- 相關(guān)推薦
基于多智能Agent計算機科學(xué)信息檢索個(gè)性化服務(wù)的探討論文
摘要:
文章論述了智能agent搜索理論的提出背景,闡述了智能agent的搜索理論及多種智能agent的功能和工作原理,并在此基礎上構建了一個(gè)基于多種智能agent個(gè)性計算機科學(xué)信息檢索系統,得出該系統是當今圖書(shū)館智能化的主動(dòng)服務(wù)模式。
關(guān)鍵詞:智能agent;智能化;主動(dòng)服務(wù);信息檢索
1、問(wèn)題的提出。
近年來(lái),隨著(zhù)振興東北老工業(yè)基地戰略的實(shí)施,齊齊哈爾大學(xué)加快計算機科學(xué)專(zhuān)業(yè)的建設與發(fā)展,檢索大量的有關(guān)計算機科學(xué)專(zhuān)業(yè)的信息資源成為學(xué)科館員的必須工作,但網(wǎng)上計算機科學(xué)信息資源浩如煙海,專(zhuān)業(yè)數據庫不計其數。通過(guò)計算機科學(xué)類(lèi)信息檢索實(shí)踐發(fā)現浩瀚如海且不斷變化的計算機科學(xué)信息資源與有效獲取之間存在著(zhù)尚需解決的技術(shù)問(wèn)題,且越來(lái)越明顯,主要表現在以下幾個(gè)方面:
。1)搜索準確性問(wèn)題。
目前我們使用的大部分搜索引擎和專(zhuān)業(yè)數據庫檢索都是依據查詢(xún)字段的匹配來(lái)收集信息,在查詢(xún)的結果中,常常包含著(zhù)一些無(wú)用信息即信息過(guò)載和資源迷向,浪費了用戶(hù)的時(shí)間與精力。
。2)個(gè)性同化問(wèn)題。
不同的用戶(hù)使用同一個(gè)搜索引擎對同一個(gè)關(guān)鍵詞進(jìn)行查找,得到的結果均是相同的,毫無(wú)個(gè)性可言。
。3)結果差異問(wèn)題。
我們對相同的“計算機編程”進(jìn)行搜索時(shí),在百度能搜到770個(gè)網(wǎng)頁(yè),而在雅虎中卻可搜到8832765個(gè)網(wǎng)頁(yè),在中國期刊全文數據庫中搜到10624篇(精確)論文,而在重慶維普數據庫中卻搜到208篇(精確)論文,體現出不同搜索引擎產(chǎn)生不同的結果,對同一關(guān)鍵詞使用不同的搜索引擎得出的結果差別很大。
。4)主動(dòng)服務(wù)問(wèn)題。
我們目前所使用的搜索引擎都是通過(guò)在搜索引擎中鍵入關(guān)鍵詞搜索才能得到所需要的信息,而引擎本身不能為用戶(hù)提供主動(dòng)的服務(wù),這是一種較為被動(dòng)的信息獲取方法。
。5)動(dòng)態(tài)監測問(wèn)題。
網(wǎng)絡(luò )中計算機科學(xué)方面的信息是實(shí)時(shí)動(dòng)態(tài)變化的,如果為計算機科學(xué)的研究提供更新的信息,我們只有花費很多時(shí)間與精力實(shí)時(shí)查詢(xún)網(wǎng)絡(luò ),才能做好服務(wù)工作,而在現有搜索引擎技術(shù)條件下,對我們來(lái)說(shuō)是極為不便的。
這些問(wèn)題正是數字圖書(shū)館個(gè)性化信息服務(wù)所要解決的。對于搜索引擎來(lái)說(shuō),也是其自身無(wú)法克服的,為適應信息的個(gè)性化需求,一種智能agent搜索工具已被研發(fā)出來(lái),在工業(yè)、商業(yè)領(lǐng)域廣泛應用,本文擬將該理論引入數字圖書(shū)館的個(gè)性化服務(wù)中來(lái),探討其在計算機科學(xué)信息檢索中的應用。
2、agent智能搜索理論。
智能agent的研究起始于20世紀90年代,是人工智能和代理技術(shù)的集成運用,它代表了信息技術(shù)最前沿的發(fā)展方向,是一個(gè)全新的研究開(kāi)發(fā)領(lǐng)域。是具有劃時(shí)代意義的智能化、主動(dòng)服務(wù)用戶(hù)的研究熱點(diǎn)。
agent智能搜索理論,核心功能就是智能代理,利用一種計算機軟件(實(shí)體)自動(dòng)執行用戶(hù)委托的任務(wù)來(lái)達到用戶(hù)的檢索需求,如學(xué)習agent、中介agent、通信agent、信息協(xié)作查詢(xún)agent、信息采集agent、信息分析agent、信息傳遞agent等等,每種智能agent都需要相應的技術(shù)支持,這些技術(shù)包括了人工智能和代理技術(shù)、神經(jīng)網(wǎng)絡(luò )技術(shù)、信息檢索技術(shù)、計算機網(wǎng)絡(luò )技術(shù)、數據庫數據挖掘技術(shù)、自然語(yǔ)言處理技術(shù)等,這些技術(shù),近年來(lái)的研究已非常成熟,在這些技術(shù)支持下的多種agent組成的智能系統已被開(kāi)發(fā)者廣泛應用于工業(yè)和商業(yè)領(lǐng)域,智能agent能把用者的需求通過(guò)自身的自治性、代理性、學(xué)習性、分析性描繪讀者需求、建立導出信息模塊、自動(dòng)搜索信息。專(zhuān)家學(xué)者設計了許多面向agent的建模語(yǔ)言以支持基于借助于面向agent的軟件,和支持不同系統模型之間轉換的軟件,以使各系統之間相互兼容,從而建立起一種逐步求精的agent系統,為解決網(wǎng)絡(luò )中計算機科學(xué)專(zhuān)業(yè)信息服務(wù)與計算機科學(xué)專(zhuān)業(yè)信息搜索問(wèn)題提供了新思路。遵循這一理論,我們進(jìn)行計算機科學(xué)專(zhuān)業(yè)專(zhuān)業(yè)智能檢索的探討。
3、基于多種智能agent的計算機科學(xué)專(zhuān)業(yè)檢索系統的工作原理。
完成用戶(hù)的完整的檢索過(guò)程需要許多智能agent的有機配合,以下分別介紹相關(guān)的agent在完成用戶(hù)檢索過(guò)程的工作原理。
。1)信息采集agent執行網(wǎng)絡(luò )的搜索任務(wù)。
信息采集agent是該系統的核心部分,信息采集agent是一組獨立運行于各個(gè)物理節點(diǎn)上的網(wǎng)絡(luò )信息搜索程序,它根據所分配的任務(wù)和知識庫中的信息對網(wǎng)絡(luò )站點(diǎn)進(jìn)行遍歷,并把采集到的信息存進(jìn)本地信息庫中。
信息采集agent工作流程如下:
、俪跏蓟瘯r(shí),信息采集agent派遣信息協(xié)作agent取回知識庫中適當的外部地址作為運行種子。
、谟扇』氐耐獠康刂纷鳛槌跏挤N子,采集該網(wǎng)站信息,并把采集到的內部地址信息存儲到本地信息庫中的內部地址列表結構中去。
、蹚谋镜匦畔熘械膬炔康刂妨斜碇腥〉刂,采集信息。
、軆炔康刂妨斜頌榭,則表示完成該網(wǎng)站采集任務(wù),執行步驟。
。2)學(xué)習agent總結用戶(hù)檢索習慣形成個(gè)性化的檢索模式。
學(xué)習agent安裝在用戶(hù)個(gè)人機上,每個(gè)用戶(hù)一個(gè)學(xué)習agent,學(xué)習agent根據用戶(hù)注冊信息了解用戶(hù)背景、興趣、愛(ài)好、檢索目的、任務(wù)等,自動(dòng)從用戶(hù)提交的初始的興趣樣本中提取特征自動(dòng)學(xué)習,并且根據用戶(hù)經(jīng)常的檢索習慣,自動(dòng)完成用戶(hù)檢索習慣的反饋學(xué)習任務(wù)和用戶(hù)個(gè)性化模式的生成。學(xué)習agent根據用戶(hù)的注冊信息能主動(dòng)地分析和獲取用戶(hù)的個(gè)性信息并根據用戶(hù)的興趣模型或當前的環(huán)境狀態(tài)了解用戶(hù)的潛在需求,以主動(dòng)服務(wù)方式提供服務(wù),例如,設定計算機科學(xué)的信息,學(xué)習agent可根據用戶(hù)的信息和檢索習慣,獲取信息服務(wù)網(wǎng)站地址,自動(dòng)監測相關(guān)網(wǎng)站的更新情況,自動(dòng)將新信息推送給用戶(hù),將主動(dòng)絡(luò )上計算機科學(xué)資源的使用現狀。
工作流程:
、賹W(xué)習agent將用戶(hù)使用類(lèi)似自然語(yǔ)言的描述限制在一個(gè)概念區域中,擁有完成學(xué)習任務(wù)的準備知。
、谌缓骯gent在用戶(hù)的教導下不斷訓練,直至能有效地找到用戶(hù)感興趣的檢索語(yǔ)言。
、蹖W(xué)習agent發(fā)揮它的學(xué)習和適應能力,形成一種記憶型的模式,能自動(dòng)代表用戶(hù)將用戶(hù)經(jīng)常檢索的問(wèn)題在網(wǎng)上搜索,推送給用戶(hù)。
。3)中介agent協(xié)調整個(gè)信息搜索過(guò)程。
中介agent在整個(gè)搜索過(guò)程中至關(guān)重要,是實(shí)現系統分布式透明性的關(guān)鍵。主要用于協(xié)調采集、管理、統計、查詢(xún)等各種agent,按其功能分類(lèi)或建立聯(lián)盟,保證各種agent之間的安全通信機制。
工作流程:
、佼攲W(xué)習agent從本地機知識庫儲存的信息狀態(tài),了解到用戶(hù)和個(gè)性化信息及多次關(guān)于計算機科學(xué)專(zhuān)業(yè)的檢索習慣形成固定的檢索模塊。
、诟鶕脩(hù)的需求自動(dòng)推送計算機科學(xué)專(zhuān)業(yè)信息給中介agent檢索。
、壑薪閍gent首先把信息傳遞給各個(gè)采集系統中的信息采集協(xié)作agent。
、苄畔⒉杉瘏f(xié)作agent,與各個(gè)信息采集agent進(jìn)行交流。
、菖c此同時(shí)中介agent與信息分析agent交流。
、扌畔⒎治鯽gent通過(guò)調取本地知識庫進(jìn)行分析,把結果通過(guò)信息分析agent遞給信息中介agent,中介agent從信息分析系統中獲得數據,再傳遞給信息采集系統,完成信息采集。
。4)信息協(xié)作agen在動(dòng)態(tài)的情況下自主完成搜索任務(wù)。
這是一個(gè)可移動(dòng)的agent(mobileagent),能根據當前動(dòng)態(tài)變化的環(huán)境狀態(tài),在無(wú)需外界參與的情況下,獨立地發(fā)現和利用完成任務(wù)所(來(lái)源:)需的資源,獨立地制定完成任務(wù)的規劃,最終實(shí)現規劃、達到目標。
工作流程:
、傩畔f(xié)作查詢(xún)agen移動(dòng)于采集系統和分析系統。
、趶男畔⒉杉痑gent和數據傳送agent處接受協(xié)作信息查詢(xún)請求。
、墼購闹薪閍gent系統獲得目標系統地址后,移動(dòng)到這個(gè)新的目標主機,完成信息查詢(xún)任務(wù)。
。5)信息傳輸agent。
信息傳輸agent負責把本地信息庫中已經(jīng)采集到的信息安全傳送到sad中去。由于各子系統分
別處于不同的物理節點(diǎn)上,數據傳送的安全性和可靠性就變得尤為重要。數據傳送agent通過(guò)與信息協(xié)作查詢(xún)agent以及中介agent的合作有效解決了這一問(wèn)題。
工作流程:
、贁祿䝼魉蚢gent向信息協(xié)作查詢(xún)agent發(fā)出對目的地系統地址的查詢(xún)請求。
、谛畔⒉樵(xún)agent從中介agent處取得數據分析子系統的ip地址,并返回給數據傳送agent。
、蹟祿䝼魉蚢gent根據所得到的目的地址,創(chuàng )建一個(gè)數據接收mobileagent,并移動(dòng)到數據分析系統所在地。
、軘祿邮誱obileagent對數據分析系統所在地的網(wǎng)絡(luò )通訊質(zhì)量和系統空閑時(shí)間進(jìn)行評價(jià);⑤若評價(jià)值滿(mǎn)足數據傳送質(zhì)量的要求,數據傳送agent開(kāi)始向數據接收agent傳送數據,直到數據傳送完畢,收回并銷(xiāo)毀數據接受mobileagent,若評價(jià)值不能滿(mǎn)足要求,直接收回并銷(xiāo)毀數據接收mobileagent。
。6)數據分析agent通過(guò)智能篩選呈現給用戶(hù)理想的檢索結果。
數據分析agent負擔著(zhù)對采集回來(lái)的數據進(jìn)行文本化、中文分詞和評價(jià)網(wǎng)站的任務(wù)。由數據接收mobileagent、信息協(xié)作查詢(xún)agent、數據分析agent協(xié)作完成。平時(shí),數據分析agent處于休眠狀態(tài),不加載入內存,當有新數據傳送到sad本地時(shí),數據分析agent被激活,從硬盤(pán)上讀入狀態(tài)數據,進(jìn)入工作狀態(tài)。
、贁祿M(jìn)行統一化,采集到的數據可能是一段html代碼、pdf文件、word文件等,統一化就是利用代碼轉換方法把這些數據轉化成純文本格式。
、谌绻渲杏兄形脑~匯,則調用中文分詞模塊進(jìn)行中文分詞,并調用專(zhuān)業(yè)詞庫與其中的專(zhuān)業(yè)詞匯相比較,統計網(wǎng)站中出現專(zhuān)業(yè)詞匯的頻率,把結果寫(xiě)入知識庫中,作為對網(wǎng)站與本專(zhuān)業(yè)相關(guān)度的評價(jià),把相關(guān)內容插入索引數據庫,若沒(méi)有中文詞匯,則與專(zhuān)業(yè)詞匯比較,并形成索引。
4、基于多種智能agent的計算機科學(xué)專(zhuān)業(yè)檢索系統的工作流程。
多種智能agent相互協(xié)作完成計算機科學(xué)檢索任務(wù)的工作流程:本地知識庫存儲用戶(hù)的注冊信息,學(xué)習agent由中介agent獲取用戶(hù)的檢索模式交給采集agen并通過(guò)采集agent采集信息,采集agent把采集的結果通過(guò)協(xié)作agent、接收agent交于分析agent,分析agent經(jīng)過(guò)處理把理想化的結果儲存到知識庫中,完成檢索任務(wù)。在整個(gè)過(guò)程中體現的是智能化的主動(dòng)的推送的服務(wù),是智能采集agen根據用戶(hù)注冊的個(gè)性化信息資料、并把多次的檢索習慣通過(guò)學(xué)習建立模塊,自動(dòng)采集網(wǎng)絡(luò ),完成服務(wù)的。整個(gè)過(guò)程體現的是主動(dòng)的服務(wù)方式,是當今圖書(shū)館智能化的主動(dòng)服務(wù)模式。
參考文獻
。1]蔡棟.第二代搜索引擎模式探析[j].情報理論與實(shí)踐,,(3)。
。2]漆宏,等。談?wù)剛(gè)性化信息服務(wù)[j]。情報資料工作,(4)。
。3]韓立新,等。一個(gè)面向internet的個(gè)性化信息檢索系統模型[j]。電子學(xué)報,(2)。
。4]劉穎.多智能agent系統的結構與功能[j].圖書(shū)情報知識,,(4)。
【基于多智能Agent計算機科學(xué)信息檢索個(gè)性化服務(wù)的探討論文】相關(guān)文章:
基于因特網(wǎng)的個(gè)性化信息服務(wù)研究10-01
基于個(gè)性化的檔案檢索方式研究09-17
基于哲學(xué)視域的科學(xué)教育探討論文08-21
計算機的現代信息檢索技術(shù)進(jìn)展綜述論文05-31
基于教育信息化的中職計算機專(zhuān)業(yè)現狀分析和發(fā)展探討論文07-29
計算機網(wǎng)絡(luò )畢業(yè)論文-基于網(wǎng)格的面向專(zhuān)業(yè)內容的Web信息檢索體系結07-02
論數字圖書(shū)館個(gè)性化信息檢索新視野10-05
基于內容的圖像檢索研究07-08