- 相關(guān)推薦
數字圖書(shū)館中個(gè)性化信息檢索研究
摘要:本文通過(guò)將智能技術(shù)應用于數字圖書(shū)館信息檢索系統,并結合Agent的特點(diǎn)和優(yōu)勢,提出了一個(gè)基于A(yíng)gent技術(shù)的個(gè)性化信息檢索模式,提高數字圖書(shū)館的個(gè)性化信息服務(wù)水平,提高信息檢準率,實(shí)現面向用戶(hù)興趣的信息搜索。
關(guān)鍵詞:數字圖書(shū)館 Agent 個(gè)性化信息服務(wù)
在網(wǎng)絡(luò )技術(shù)迅速發(fā)展的今天,人們已經(jīng)從信息匱乏時(shí)代進(jìn)入到信息爆炸的時(shí)代,但是人們在認知過(guò)程中所面臨的供求矛盾并沒(méi)有由此而得到解決。數字圖書(shū)館的個(gè)性化信息檢索技術(shù)為解決這一矛盾提供了可行性。
1、個(gè)性化信息檢索的Agent技術(shù)
1.1 Agent的概念
Agent是在分布式系統中持續自主發(fā)揮作用的并且能以主動(dòng)交互服務(wù)的方式完成一系列操作的計算實(shí)體,是一種基于分布式系統技術(shù)的設計模式。
1.2 Agent的基本結構
Agent基本結構分為三部分既信息處理系統、引擎模塊、內部狀態(tài)集。
(1)信息處理系統是Agent的行為控制系統。Agent的活性正是表現在它的事件處理系統上。在該結構中,信息是與Agent有關(guān)的特定狀態(tài)。信息處理系統涉及三個(gè)環(huán)節的活動(dòng)即信息的感應、信息的適配、信息的處理。信息的感應,Agent在信息感應環(huán)節中時(shí)刻捕捉其所關(guān)注的信息狀態(tài)的出現。并根據其活動(dòng)類(lèi)型啟動(dòng)相應的信息適配器工作。信息的適配,信息的適配主要是Agent通過(guò)適配器獲取相關(guān)事件信息作識別。在A(yíng)gent的基本結構中適配器作為外界與Agent交流信息的接口來(lái)使用。信息的處理,Agent通過(guò)信息的感應和適配表明了當前信息檢索事件的表征狀態(tài),而信息的處理這一環(huán)節正是通過(guò)對信息檢索事件的表征狀態(tài)的處理使Agent智能化的不斷發(fā)生變化。
(2)引擎模塊是Agent的核心。Agent的引擎種類(lèi)主要有以下三種觸發(fā)引擎、反射引擎、執行引擎。觸發(fā)引擎,當出現某些事件時(shí),觸發(fā)引擎就操縱事件的規則,執行復雜的推理以決定事件的反映。比如說(shuō)一個(gè)傳遞給A的服務(wù)器請求導致消息事件的發(fā)生。A的(消息)事件感知將及時(shí)檢測該事件的發(fā)生’從而引發(fā)A的(消息)事件適配接收此消息。反射引擎,其作用是檢測事件并且反映出Agent現有的狀態(tài)。執行引擎,信息檢索事件發(fā)生時(shí)能夠使用虛擬機系統調用Java或者調用腳本語(yǔ)言解釋系統?偟膩(lái)看,引擎模塊主要負責處理人機之間檢索信息的互動(dòng),具有交互與協(xié)調功能。
(3)內部狀態(tài)集是表現Agent當前狀態(tài)的成分,它包括感知器、適配信息、數據庫信息。感知器,感知器時(shí)刻感應檢索信息的出現。適配信息,從感知器接受信息,并且對其做出反映并提供與其它信息資源做出連接。比如用戶(hù)界面信息、連接指引信息等。數據庫信息,為了方便信息的查詢(xún)及共享使信息以某種標準格式存儲在庫里。
2、Agent的個(gè)性化信息檢索結構體系
2.1 現有的個(gè)性化信息檢索結構體系的缺陷
(1)較少的考慮用戶(hù)的差異,適應用戶(hù)興趣變化能力差
(2)綜合利用個(gè)性化信息檢索優(yōu)勢性差
(3)用戶(hù)與檢索系統交互方式比較單一
(4]檢索精度和效率低
(5)動(dòng)態(tài)監測能力差
2.2 Agent個(gè)性化信息檢索的結構體系總體建設思路
通過(guò)對現有的個(gè)性化檢索結構體系缺陷的分析,我們提出了基于A(yíng)gent的個(gè)性化信息檢索結構體系。
3.Agent的個(gè)性化信息檢索
根據以上對基于A(yíng)gent個(gè)性化信息檢索結構體系的思路分析,筆者提出了以下新的基于A(yíng)gen價(jià)性化信息檢索模型
3.1 針對現有的個(gè)性化信息檢索模型的缺陷進(jìn)行了如下的改進(jìn):
(1)進(jìn)一步的考慮到用戶(hù)的差異并采取循環(huán)反饋的措施使的系統給出結果能夠自適應于用戶(hù)查詢(xún)興趣的變化。并在用戶(hù)接口和用戶(hù)數據庫連接環(huán)節除了采用相關(guān)問(wèn)題反饋和聚類(lèi)處理還采用了更新創(chuàng )建用戶(hù)檔案的措施,進(jìn)一步提高了查詢(xún)效率。
(2)采用了基于內容和查詢(xún)協(xié)作的雙向混合過(guò)濾,使的查詢(xún)結果更加準確。
3.2 工作流程描述如下:
(1)用戶(hù)描述興趣和提出檢索請求,在用戶(hù)接口部分用戶(hù)Agent接受該請求,調用用戶(hù)信息數據庫中的用戶(hù)個(gè)性化信息,通過(guò)推理產(chǎn)生精化的個(gè)性化檢索模式。
(2)啟動(dòng)信息檢索模塊,調用元搜索引擎去檢索與用戶(hù)興趣最為相關(guān)的信息,同時(shí)通過(guò)情景關(guān)注Agent對信息動(dòng)態(tài)變化予以關(guān)注。并且進(jìn)一步通過(guò)基于多Agent協(xié)同合作的檢索器進(jìn)行提取和分解有用信息。
(3)結合搜索引擎調度機制及用戶(hù)個(gè)性化信息推送Agent,根據查詢(xún)請求及對用戶(hù)需求分析,進(jìn)行搜索,并將信息搜索Agent搜集來(lái)的信息裝入數據庫,自動(dòng)分類(lèi),搜索工作是時(shí)時(shí)進(jìn)行的。
(4)系統將用戶(hù)需要的信息通過(guò)個(gè)性化信息推送Agent、信息過(guò)濾Agent、信息挖掘Agent等多個(gè)Agent間的協(xié)作處理后提供給用戶(hù),還可以向用戶(hù)推薦最新的和其他興趣相似的用戶(hù)感興趣的信息,同時(shí)更新通用興趣主題庫。
(5)通過(guò)相關(guān)問(wèn)題反饋和聚類(lèi)處理模塊,將用戶(hù)評價(jià)記錄到相應的知識庫中。同時(shí)更新用戶(hù)興趣檔案。
(6)收集從各個(gè)選中的搜索引擎所返回的結果,消除無(wú)效的鏈接頁(yè)面,去除重復、多余的信息,按照相關(guān)性進(jìn)行排序。
(7)根據用戶(hù)要求,把這些信息依照相關(guān)性從高到低的順序按照統一的格式返回給用戶(hù)。
(8)用戶(hù)通過(guò)瀏覽返回的結果確認是否為感興趣的信息,并將反饋結果交給用戶(hù)信息數據庫進(jìn)行聚類(lèi),精化用戶(hù)信息數據庫信息。
4、結 語(yǔ)
數字圖書(shū)館個(gè)性化信息檢索是對數字圖書(shū)館實(shí)現“以用戶(hù)為中心”的信息服務(wù)模式的有益嘗試。數字圖書(shū)館的個(gè)性化信息檢索的實(shí)現是一項十分復雜的工作。他依賴(lài)與很多技術(shù)的發(fā)展。目前雖然取得了一些進(jìn)展但尚存在需要完善和改進(jìn)的地方。因此,我們應該將更多科研成果應用與其中,加強對模型的研發(fā),以推出效率更高的檢索模型。
【數字圖書(shū)館中個(gè)性化信息檢索研究】相關(guān)文章:
基于個(gè)性化的檔案檢索方式研究12-02
數字圖書(shū)館個(gè)性化服務(wù)方式綜述12-07
談高職院校圖書(shū)館的個(gè)性化信息服務(wù)03-21
地方文獻數字化:中國數字圖書(shū)館工程的信息基礎03-20
基于PDCA的數字圖書(shū)館質(zhì)量管理研究03-18
服務(wù)品質(zhì)與高校數字圖書(shū)館網(wǎng)站建設研究03-21
基于內容的圖像檢索研究11-20