激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频

數據挖掘技術(shù)在Web信息檢索中的應用研究論文

時(shí)間:2024-07-02 10:34:37 其他類(lèi)論文 我要投稿

數據挖掘技術(shù)在Web信息檢索中的應用研究論文

  [摘要]將數據挖掘技術(shù)應用到Web信息檢索中,可以使網(wǎng)絡(luò )信息檢索更加準確化和智能化。介紹了Web數據挖掘的概念,分析了Web數據挖掘在Web信息檢索中的應用,最后對Web信息檢索未來(lái)發(fā)展進(jìn)行了展望。

數據挖掘技術(shù)在Web信息檢索中的應用研究論文

  [關(guān)鍵詞]數據挖掘;Web信息檢索;搜索引擎

  [中圖分類(lèi)號]P209[文獻標志碼]A[文章編號]2096-0603(2017)29-0033-01

  Web現已成為一個(gè)巨大的知識庫、信息庫,Web信息檢索通過(guò)搜索引擎返回給用戶(hù)成千上萬(wàn)個(gè)檢索到的網(wǎng)頁(yè),但是滿(mǎn)足用戶(hù)檢索要求的網(wǎng)頁(yè)卻鳳毛麟角,用戶(hù)無(wú)法在第一時(shí)間得到滿(mǎn)足要求的有價(jià)值信息。因此,Web信息檢索的精度不能為客戶(hù)提供準而精的檢索信息,需要檢索精度更高的數據挖掘技術(shù)。

  所謂數據挖掘(DataMining)就是從海量的原始數據中提取信息和知識的過(guò)程,這些信息和知識隱含在原始數據中,事先未知,但是對用戶(hù)來(lái)說(shuō)是很有用的。

  一般的數據挖掘對象是結構化數據,而Web數據挖掘的對象是非結構化數據,在現有數據挖掘研究成果的基礎上,運用Web數據挖掘技術(shù),可以提高信息檢索的精準率和有效率,Web信息檢索將會(huì )達到向一個(gè)新的高度。

  一、Web數據挖掘技術(shù)概述

  Web數據挖掘是一項綜合技術(shù),是從WWW資源上抽取信息(或知識)的過(guò)程,是對Web資源中蘊涵的未知的有潛在應用價(jià)值的模式的提取[1]。按挖掘對象來(lái)分類(lèi),基于Web的數據挖掘分為3大類(lèi):基于Web內容的挖掘(WebContentMining)、基于WEB結構的挖掘(WebStructureMining)、基于WEB使用的挖掘(WebUsageMining)。

 。ㄒ唬┗赪eb內容的挖掘

  基于Web內容的挖掘,是在Web文檔以及相應的Web文檔描述中獲取知識。目前,WWW信息資源是網(wǎng)絡(luò )信息資源的主要組成部分,用戶(hù)直接從網(wǎng)上抓取這些資源,并為之建立索引,從而實(shí)現查詢(xún)服務(wù),而那些被隱藏起來(lái)的數據,用戶(hù)無(wú)法進(jìn)行有效的檢索,這就迫使我們把這些被隱藏的內容(比如數據庫系統中的數據,由用戶(hù)的提問(wèn)而動(dòng)態(tài)生成的結果等)挖掘出來(lái)。此外,Web的信息內容是由文本、音頻、視頻、圖片等非結構化的數據,因此基于Web內容的挖掘也是一種針對多媒體數據的挖掘[2]。

 。ǘ┗赪eb結構的挖掘

  基于Web結構的挖掘,主要挖掘Web潛在的鏈接結構模式,是從網(wǎng)頁(yè)上的相互鏈接和萬(wàn)維網(wǎng)的整體結構中發(fā)現知識的過(guò)程。這種模式主要采用網(wǎng)頁(yè)歸類(lèi)技術(shù),在眾多的網(wǎng)頁(yè)中獲得不同網(wǎng)頁(yè)間的信息,比如相似度及關(guān)聯(lián)度。Web結構挖掘主要是幫助用戶(hù)找到所需要信息的權威站點(diǎn),同時(shí)也會(huì )對Web信息檢索結果的排序產(chǎn)生影響。

 。ㄈ┗赪eb使用的挖掘

  基于Web使用的挖掘,也可以稱(chēng)之為WebLogMining,Web日志挖掘,用戶(hù)在進(jìn)行網(wǎng)絡(luò )訪(fǎng)問(wèn)后,會(huì )留下一些重要的第二手數據,它們是Web使用挖掘的主要對象,從而分析用戶(hù)的網(wǎng)絡(luò )行為提供依據。

  二、Web數據挖掘在Web信息檢索中的應用

 。ㄒ唬⿲eb信息源進(jìn)行挖掘,形成信息源知識庫

  對Web信息源內容的挖掘,主要是針對中多媒體數據等Web信息源的內容的特征進(jìn)行挖掘,統計方法、機器學(xué)習、神經(jīng)網(wǎng)絡(luò )、人工智能是最常使用的方法,通過(guò)抽取、分類(lèi)、聚類(lèi)網(wǎng)頁(yè)內容的特征,形成信息源知識庫。

  對Web信息源結構的挖掘,主要通過(guò)相關(guān)算法對Web頁(yè)面的超鏈接關(guān)系、URL地址結構的進(jìn)行挖掘,在Web的組織結構和鏈接關(guān)系中發(fā)現知識。

 。ǘ⿲eb結構進(jìn)行挖掘,形成權威網(wǎng)頁(yè)

  搜索引擎的作用主要有兩個(gè),一是搜索與主題相關(guān)的內容,二是篩選高水平的相關(guān)網(wǎng)頁(yè),就是我們所說(shuō)的權威網(wǎng)頁(yè)。第二個(gè)作用尤其重要,因為用戶(hù)更希望他們最需要的信息能在最短的時(shí)間內呈現在他們面前,而不是浪費大量的精力和時(shí)間從大量的檢索結果中找尋最需要的信息,采用Web結構挖掘的一些經(jīng)典算法就能很好地識別出權威網(wǎng)頁(yè)。

 。ㄈ⿲τ脩(hù)的訪(fǎng)問(wèn)模式進(jìn)行分析,為用戶(hù)提供更加人性化的服務(wù)

  用戶(hù)在進(jìn)行信息檢索時(shí),會(huì )在網(wǎng)站上留下許多信息,比如檢索的時(shí)間、檢索詞以及瀏覽了哪些檢索結果等;赪eb使用的挖掘可以對其進(jìn)行分析,采用各種算法對這些日志展開(kāi)挖掘,從而延伸出更有價(jià)值的內容,形成用戶(hù)知識模型,并對用戶(hù)潛在相同的檢索行為模式進(jìn)行歸納總結,對這些模式進(jìn)行系統的研究,對搜索引擎的檢索效果進(jìn)行反饋,從而改進(jìn)搜索引擎,讓檢索結果更加智能化,使單個(gè)用戶(hù)感覺(jué)使用Web信息檢索更高效。

  總之,隨著(zhù)互聯(lián)網(wǎng)的發(fā)展,數據挖掘的一個(gè)主要應用領(lǐng)域就是Web數據挖掘,與Web信息檢索有著(zhù)密切的關(guān)系,但是又比Web信息檢索有著(zhù)更高的技術(shù)層次,可以使基于Web的信息檢索發(fā)展到一個(gè)更高的水平。

  參考文獻:

  [1]韓家煒,孟小峰,王靜,等.WEB挖掘研究[J].計算機研究與發(fā)展,2001,38(4):405-414.

  [2]涂承勝,魯明羽,陸玉昌.Web內容挖掘技術(shù)研究[J].計算機應用研究,2003,20(11):5-9.

【數據挖掘技術(shù)在Web信息檢索中的應用研究論文】相關(guān)文章:

數據挖掘技術(shù)在高校學(xué)生成績(jì)分析中的應用研究論文03-15

數據挖掘技術(shù)在中等職業(yè)學(xué)校管理實(shí)踐中的應用研究11-19

數據挖掘在電力企業(yè)中的應用論文12-13

數據挖掘技術(shù)的教學(xué)輔助系統應用論文03-16

數據挖掘技術(shù)在就業(yè)指導的應用論文02-27

信息檢索與利用論文01-01

網(wǎng)絡(luò )信息檢索論文01-20

數據挖掘在現代遠程教育中的應用論文11-22

信息檢索畢業(yè)論文12-08

  • 相關(guān)推薦
激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频