網(wǎng)絡(luò )教學(xué)資源搜索增強論述論文
摘要:網(wǎng)絡(luò )教學(xué)資源服務(wù)對象包括教師、學(xué)生、社會(huì )培訓者等,其對應多種學(xué)科、類(lèi)別,資源數量較大,用戶(hù)需要通過(guò)搜索獲取所需的特定資源,因此如何提高資源搜索的性能和實(shí)用性就十分重要。文章主要針對網(wǎng)絡(luò )教學(xué)資源的搜索性能、實(shí)用性進(jìn)行搜索增強研究。
關(guān)鍵詞:教學(xué)資源;搜索增強;性能;實(shí)用性
伴隨著(zhù)網(wǎng)絡(luò )技術(shù)的不斷發(fā)展,教育對教學(xué)資源建設的重視,為網(wǎng)絡(luò )教學(xué)資源庫的建設提供了契機。網(wǎng)絡(luò )教學(xué)資源服務(wù)的對象包括:教師、學(xué)生、社會(huì )培訓者等,其對應多種學(xué)科、類(lèi)別,資源數量較大。用戶(hù)對資源的需求不一樣,需要通過(guò)搜索獲取所需的特定資源,因此如何提高資源搜索的性能、實(shí)用性是網(wǎng)絡(luò )教學(xué)資源庫開(kāi)發(fā)所需要解決的一個(gè)重要問(wèn)題。本文主要針對網(wǎng)絡(luò )教學(xué)資源搜索的性能、實(shí)用性進(jìn)行增強研究。
1搜索性能增強策略研究
1.1使用索引提高搜索性能
索引是對列值進(jìn)行排序的一種結構,正確地利用索引能夠加快對數據表相應信息的訪(fǎng)問(wèn)[1]。索引雖然能夠提高數據的檢索性能,但是也提高了數據維護的成本。因此,要合理使用索引,在創(chuàng )建索引前,需要確定使用哪些列和要創(chuàng )建的索引類(lèi)型。索引包括聚集索引和非聚集索引[2]。聚集索引適用于含有大量的不重復值的列、可用于范圍值計算的列、結果集較大的查詢(xún)及經(jīng)常使用連接或分組的列,非聚集索引中鍵值邏輯順序和物理順序沒(méi)有關(guān)系。將主鍵設置為聚集索引并非最佳方案,在教學(xué)資源庫中資源編號是標記列且設為主鍵,會(huì )把資源編號設置成聚集索引。在實(shí)際應用中,并不會(huì )針對資源編號進(jìn)行搜索,這就導致讓資源編號作為聚集索引是不正確的選擇。其次,資源編號都不相同,也不符合“很多數據不同值的列不應該設置聚合索引”的規則。下面以在1000萬(wàn)條數據量的資源信息表中查詢(xún)近180天的資源信息速度為例(180天內的資源信息數據為30萬(wàn)條,數據通過(guò)程序生成,供測試使用),其分析如表1所示。表1索引設置與用時(shí)對比索引設置用時(shí)(毫秒)只在主鍵(資源編號)上設置聚集索引129652主鍵(資源編號)上設置聚集索引,日期上設置非聚集索引54128在發(fā)布日期(vDate)上建立聚集索引2446通過(guò)上述的數據分析,正確地建立聚集索引是十分有必要的。必須根據實(shí)際中的應用范圍和數據本身的構成來(lái)確定聚集索引,而非固定使用默認的主鍵作為聚集索引。
1.2優(yōu)化SQL語(yǔ)句提高搜索性能
數據庫管理系統本身具備了一定的查詢(xún)分析優(yōu)化能力。在MSSQL中的“查詢(xún)分析優(yōu)化器”,會(huì )檢測查詢(xún)的各個(gè)組成部分,并判斷要求掃描的組成部分是不是有用,如果某個(gè)組成部分能夠作為一個(gè)掃描參數,則稱(chēng)該組成部分為可優(yōu)化,并使用索引對所需數據進(jìn)行快速獲取。如果某個(gè)表達式不能滿(mǎn)足掃描參數的條件,就不能控制掃描范圍,“索引”對不符合掃描參數條件的表達式是起到作用的。因此,在SQL查詢(xún)語(yǔ)句的編寫(xiě)過(guò)程,要注意where子句的優(yōu)化,讓“索引”的作用得以充分發(fā)揮,最大限度地提高搜索性能。在搜索過(guò)程對信息字段的獲取要遵循“需要多少,提取多少”的準則[3],不要采用“select*”。字段提取的多少對速度的影響如表2所示。1.3自定義分頁(yè)提高搜索性能在數據的查詢(xún)過(guò)程中,若一次性將查詢(xún)結果讀出,當數據量較大時(shí),勢必需要消耗較多的讀取時(shí)間,影響搜索結果的最終呈現速度。因此,在項目的實(shí)際開(kāi)發(fā)中,可以應用自定義分頁(yè)的形式提高搜索的性能,若將實(shí)現自定義分頁(yè)的過(guò)程使用存儲過(guò)程的方式來(lái)實(shí)現,充分利用存儲過(guò)程的優(yōu)點(diǎn),搜索性能將會(huì )得到更進(jìn)一步的提高。自定義分頁(yè)每次查詢(xún)只從查詢(xún)結果中讀出當前頁(yè)所需的數據,以資源搜索結果為2000條數據,系統每頁(yè)呈現20條數據為例,普通分頁(yè)與自定義分頁(yè)相比,如圖1—2所示。通過(guò)圖1—2可以看出,采用自定義分頁(yè),僅從數據表中讀出當前頁(yè)的20條,數據控件也不需要進(jìn)行控件內分頁(yè),其性能在數據讀取和數據呈現上都有良好的提升。
2搜索實(shí)用性增強策略研究
2.1純粹模糊查詢(xún)實(shí)現搜索的不足分析
純粹模糊查詢(xún)實(shí)現搜索指在搜索的過(guò)程中,僅將用戶(hù)輸入的關(guān)鍵字在數據的查詢(xún)過(guò)程中,用數據庫本身提供的模糊查詢(xún)功能,與數據庫表中的相關(guān)字段值進(jìn)行匹配,并將匹配正確的值提取至搜索結果。其操作簡(jiǎn)單,但存在以下2點(diǎn)不足:(1)相關(guān)詞無(wú)法匹配。相關(guān)詞無(wú)法匹配造成搜索結果的部分性,是純粹模糊查詢(xún)的最大不足之處。(2)容錯性低。由于未對輸入的搜索關(guān)鍵詞進(jìn)行分析,一旦關(guān)鍵詞中包含無(wú)用詞或錯別詞時(shí),將導致搜索結果零數據返回。通過(guò)上述分析,要解決相關(guān)詞無(wú)法匹配和容錯性低的兩大不足,需要對搜索實(shí)用性增強進(jìn)行研究。
2.2增強相關(guān)詞匹配
相關(guān)詞的界定很難由程序自動(dòng)判斷,因為相關(guān)詞有客觀(guān)構成,也有主觀(guān)構成。如:電腦與計算機、computer為客觀(guān)相關(guān)詞,而電腦與微軟、馮諾依曼則為主觀(guān)相關(guān)詞?陀^(guān)相關(guān)詞為事實(shí)存在,為大多人所共知,而主觀(guān)相關(guān)詞需要在特定的條件下成立,人們通過(guò)“電腦”可以聯(lián)系到軟件巨頭“微軟公司”或計算機科學(xué)家“馮諾依曼”,需要一定的知識延展性,甚至“電腦”可以延伸到“計算器”,不同的用戶(hù)有不同的認識。因此,主觀(guān)相關(guān)詞具備一定的不確定性與抽象的特點(diǎn)。增強相關(guān)詞匹配可通過(guò)增加相關(guān)詞字段或建立相關(guān)詞庫的方法來(lái)實(shí)現。相關(guān)詞的匹配涉及匹配的深度和廣度,越全面、精準則其投入成本越高。增加相關(guān)詞字段。指通過(guò)在數據表中增加“相關(guān)詞”字段,當用戶(hù)在添加信息時(shí),輸入與此信息的相關(guān)詞。相關(guān)詞的界定及輸入由信息編輯者進(jìn)行操作,采用增加相關(guān)詞字段的方式來(lái)提高相關(guān)詞匹配,其實(shí)現方式簡(jiǎn)單,操作過(guò)程也容易,但相關(guān)詞的界定由編輯者確定,相關(guān)詞的個(gè)人主觀(guān)性較強。建立相關(guān)詞庫。指通過(guò)建立相關(guān)詞庫表,當用戶(hù)輸入搜索關(guān)鍵詞時(shí),系統自動(dòng)在相關(guān)詞庫表中搜索其相關(guān)詞,一并歸入關(guān)鍵詞中進(jìn)行處理,對搜索的實(shí)用性有很大的提高。當用戶(hù)輸入搜索關(guān)鍵詞時(shí),系統將自動(dòng)遍歷搜關(guān)鍵詞的相關(guān)詞,達到相關(guān)詞匹配的目的。建立相關(guān)詞庫的方式,其相關(guān)詞并非由編輯者個(gè)人界定,而且相關(guān)詞可以靈活調整,不斷補充。因此,建立相關(guān)詞庫的方式更加全面、客觀(guān),但構建一個(gè)完善的相關(guān)詞庫需要較大的投入。增加相關(guān)詞字段與建立相關(guān)詞庫兩者各有優(yōu)缺點(diǎn),但兩者并非對立。在一個(gè)系統中,可以同時(shí)采用這2種方式或者其中之一以增強搜索相關(guān)詞匹配,提高搜索實(shí)用性。具體實(shí)施方案還需要考慮到實(shí)際需求和投入成本預算。
2.3增強搜索容錯性
在搜索的過(guò)程中,用戶(hù)對搜索關(guān)鍵詞的輸入具備不確定和冗長(cháng)等特點(diǎn)。不確定主要指關(guān)鍵詞的選詞不確定和關(guān)鍵詞的是否正確不確定,而冗長(cháng)指用戶(hù)輸入的搜索關(guān)鍵詞包含多余的信息。如果系統的搜索過(guò)程未對用戶(hù)輸入的搜索關(guān)鍵詞進(jìn)行分析和處理,那么,其搜索結果將有可能得不到用戶(hù)所需要的數據。從搜索易用性與實(shí)用性的角度出發(fā),搜索功能必須具備一定的容錯性。要增強搜索的容錯性,就需要解決搜索關(guān)鍵詞的不確定與冗長(cháng)的特點(diǎn)。將搜索關(guān)鍵詞按一定的規則進(jìn)行拆分,簡(jiǎn)稱(chēng)分詞。將長(cháng)詞轉化為短詞,并舍去重復的部分,可以提高搜索相關(guān)詞的匹配,降低長(cháng)詞中錯詞、別詞的構成,從而提高搜索的容錯性。分詞搜索可以在一定程度上解決搜索的容錯要求,提升搜索的功能與精確度。分詞技術(shù)主要分為3種:(1)字符串匹配的分詞方法。字符串匹配的分詞又分為4種,分別是:正向最大匹配法、反向最大匹配法、最短路徑匹配法、雙向最大匹配法。(2)詞義分詞法。詞義分詞法根據機器語(yǔ)音進(jìn)行分詞判斷,通過(guò)對句法、語(yǔ)義的分析,使用句法信息、語(yǔ)義信息進(jìn)行分詞。但詞義分詞法目前還不成熟,尚處于測試階段。(3)統計分詞法。統計分詞法依據詞組的統計,針對相鄰的字出現的次數多少,認定詞的重要程度,作為關(guān)鍵詞的分詞分隔符。盤(pán)古分詞作為一種分詞組件,大大降低了系統進(jìn)行分詞搜索的投入成本,避免重復造車(chē)的現象,非常方便應用在基于.NET技術(shù)進(jìn)行開(kāi)發(fā)的系統中。
3結語(yǔ)
通過(guò)對索引的合理利用、SQL語(yǔ)句的優(yōu)化和自定義分頁(yè)的使用,對搜索性能有良好的提升,融入盤(pán)古分詞的強大功能,結合相關(guān)詞匹配技術(shù),能夠提高搜索的實(shí)用性。本文從搜索性能與實(shí)用性?xún)煞矫嫜芯苛怂阉髟鰪娂夹g(shù),并將其應用于學(xué)院的教學(xué)資源庫建設中,雖然取得了一定的成效,但還需要繼續努力。
[參考文獻]
。1]張玉峰,袁方,湛燕,等.基于索引結構的關(guān)系數據庫關(guān)鍵詞檢索[J].河北大學(xué)學(xué)報(自然科學(xué)版),2015(1):95-101.
。2]魏威,馬國峰.基于索引的關(guān)系數據庫查詢(xún)優(yōu)化[J].洛陽(yáng)大學(xué)學(xué)報,2007(2):83-86.
。3]徐新靜.SQL優(yōu)化技術(shù)及應用[J].天津冶金,2011(2):25-27.
【網(wǎng)絡(luò )教學(xué)資源搜索增強論述論文】相關(guān)文章:
論述網(wǎng)絡(luò )教學(xué)資源組織模式在遠程開(kāi)放教育課程資源建設中的應用12-06
論述多媒體網(wǎng)絡(luò )教學(xué)課件的優(yōu)化設計12-05
網(wǎng)絡(luò )資源的高校計算機教學(xué)應用論文02-26
關(guān)于網(wǎng)絡(luò )資源對中學(xué)英語(yǔ)教學(xué)的應用的論文03-17
面向網(wǎng)絡(luò )爬蟲(chóng)的企業(yè)網(wǎng)站搜索引擎優(yōu)化論文12-09
社會(huì )保險在人力資源中管理中的意義論述論文11-15
畢業(yè)論文答辯的論述12-09
高校體育教學(xué)改革論述論文3篇02-18
如何增強課堂教學(xué)的有效性論文07-01
教學(xué)資源平臺在醫學(xué)教學(xué)中的應用論文論文11-14
- 相關(guān)推薦