- 相關(guān)推薦
Web數據挖掘及其在電子商務(wù)中的應用研究論文
[摘要] 電子商務(wù)是現代商業(yè)模式,數據挖掘是先進(jìn)的信息處理技術(shù),因此數據挖掘在電子商務(wù)中具有廣闊的應用前景。本文主要介紹了web數據挖掘的概念和分類(lèi),論述了電子商務(wù)中web數據挖掘的過(guò)程和方法,最后闡述了web數據挖掘技術(shù)在電子商務(wù)中的應用。
[關(guān)鍵詞] web 數據挖掘 電子商務(wù)
一、引言
電子商務(wù)是利用計算機技術(shù)、網(wǎng)絡(luò )技術(shù)和遠程通信技術(shù),實(shí)現整個(gè)商務(wù)(買(mǎi)賣(mài))過(guò)程中的電子化、數字化和網(wǎng)絡(luò )化。在全球范圍內,基于internet的電子商務(wù)迅猛發(fā)展,促使各企業(yè)經(jīng)營(yíng)者必須及時(shí)搜集大量的數據,并且將這些數據轉換成有用的信息,為企業(yè)創(chuàng )造更多潛在的利潤。利用web數據挖掘技術(shù)可以有效地幫助企業(yè)分析從網(wǎng)上獲取的大量數據,提取出有效信息,進(jìn)而指導企業(yè)調整營(yíng)銷(xiāo)策略,給客戶(hù)提供動(dòng)態(tài)的個(gè)性化的高效率服務(wù)。
二、web數據挖掘
1.web數據挖掘的概念
數據挖掘是指從數據庫中的大量數據中揭示出隱含的、先前未知的并有潛在價(jià)值的信息的過(guò)程。web數據挖掘是數據挖掘技術(shù)在web環(huán)境下的應用,是從web文檔和web活動(dòng)中發(fā)現潛在的、有用的模式或信息。它是一項綜合技術(shù),涉及到internet、人工智能、計算機語(yǔ)言學(xué)、信息學(xué)、統計學(xué)等多個(gè)領(lǐng)域。
2.web數據挖掘的類(lèi)型
電子商務(wù)中web信息的多樣性決定了挖掘任務(wù)的多樣性。按照web處理對象的不同,web數據挖掘可以分為以下三種類(lèi)型:
(1)web內容挖掘(web content mining):可分為web頁(yè)面內容挖掘和搜索結果挖掘。WWW.133229.COM前者指的是對web頁(yè)面上的數據進(jìn)行挖掘。而后者指的是以某一搜索引擎為基礎,對已搜索結果的挖掘,以得到更精確有用的信息。web內容挖掘常用的方法有weboql和ahoy。
(2)web結構挖掘(web structure mining):可分為超鏈接挖掘、內容挖掘和url挖掘。整個(gè)web空間里,有用的知識不僅包含在web頁(yè)面的內容之中,而且包含在頁(yè)面的結構之中。web結構挖掘是挖掘web潛在的鏈接結構模式,是對web頁(yè)面超鏈接關(guān)系、文檔內部結構、文檔url中的目錄途徑結構的挖掘。page2rank方法就是利用文檔間鏈接信息來(lái)查找相關(guān)的web頁(yè)。
(3)web使用挖掘(web usage mining):可分為一般訪(fǎng)問(wèn)模式挖掘和個(gè)性化服務(wù)模式挖掘。它是從web的訪(fǎng)問(wèn)記錄中抽取感興趣的模式。/dianzijixie/">電子商務(wù)中,關(guān)聯(lián)規則的發(fā)現也就是找到客戶(hù)對網(wǎng)站上各種文件之間訪(fǎng)問(wèn)的相互聯(lián)系。聯(lián)系的問(wèn)題就是得到如下形式的規則:“”, 其中與均為在數據庫中相關(guān)數據特征屬性值的集合。例如,用關(guān)聯(lián)規則技術(shù),我們可以發(fā)現:如果客戶(hù)在一次訪(fǎng)問(wèn)行為中,訪(fǎng)問(wèn)了頁(yè)面/page1時(shí),一般也會(huì )訪(fǎng)問(wèn)頁(yè)面/page2。進(jìn)行web上的數據挖掘,構建關(guān)聯(lián)模型,我們可以更好地組織站點(diǎn),減少用戶(hù)過(guò)濾信息的負擔,實(shí)施有效的市場(chǎng)策略,增加交叉銷(xiāo)售量。
4.序列模式(sequential pattern)
序列模式分析的目的是為了挖掘出數據間的前后或因果關(guān)系,就是在時(shí)間戳有序的事務(wù)集中,找到那些“一些項跟隨另一個(gè)項”的內部事務(wù)模式。例如,在/page1上進(jìn)行過(guò)在線(xiàn)訂購的顧客,有60%的人在過(guò)去10天內也在/page2上下過(guò)定單。通過(guò)序列模式的發(fā)現,能夠便于電子商務(wù)的經(jīng)營(yíng)者預測客戶(hù)的訪(fǎng)問(wèn)模式,在服務(wù)器方選取有針對性的頁(yè)面,以滿(mǎn)足訪(fǎng)問(wèn)者的特定要求;網(wǎng)站的管理員可將訪(fǎng)問(wèn)者按瀏覽模式分類(lèi),在頁(yè)面上只展示具有該瀏覽模式的訪(fǎng)問(wèn)者經(jīng)常訪(fǎng)問(wèn)的鏈接,而用一個(gè)“更多內容”指向其他未被展示的內容。當訪(fǎng)問(wèn)者瀏覽到某頁(yè)面時(shí),檢查他的瀏覽所符合的序列模式,并在顯眼的位置提示“訪(fǎng)問(wèn)該頁(yè)面的人通常接著(zhù)訪(fǎng)問(wèn)”的若干頁(yè)面。
5.分類(lèi)規則(classification regulation)
分類(lèi)要解決的問(wèn)題是為一個(gè)事件或對象歸類(lèi)。設有一個(gè)數據庫和一組具有不同特征的類(lèi)別(標記),該數據庫中的每一個(gè)記錄都賦予一個(gè)類(lèi)別的標記,這樣的數據庫稱(chēng)為示例數據庫或訓練集。分類(lèi)分析就是通過(guò)分析示例數據庫中的數據,為每個(gè)類(lèi)別做出準確的描述或建立分析模型或挖掘出分類(lèi)規則,然后用這個(gè)分類(lèi)規則對其它數據庫中的記錄進(jìn)行分類(lèi)。例如,經(jīng)過(guò)web挖掘發(fā)現,在/page1進(jìn)行過(guò)在線(xiàn)訂購的客戶(hù)中有60%是20歲~30歲生活在大中城市的年輕人。得到分類(lèi)后,就可以針對這一類(lèi)客戶(hù)的特點(diǎn)展開(kāi)商務(wù)活動(dòng),提供有針對性的個(gè)性化的信息服務(wù)。用于分類(lèi)分析的方法有統計方法的貝葉斯分類(lèi)、機器學(xué)習的判定樹(shù)歸納分類(lèi)、神經(jīng)網(wǎng)絡(luò )的后向傳播分類(lèi)、k-最臨近分類(lèi)、mbr、遺傳法、粗糙集和模糊集等。
6.聚類(lèi)分析(clustering analysis)
聚類(lèi)分析不同于分類(lèi)規則,其輸入集是一組未標定的記錄,也就是說(shuō),此時(shí)輸入的記錄還沒(méi)有進(jìn)行任何分類(lèi)。其目的是根據一定的規則,合理地劃分記錄集合,并用顯式或隱式的方法描述不同的類(lèi)別。在電子商務(wù)中,通過(guò)聚類(lèi)具有相似瀏覽行為的客戶(hù),可使經(jīng)營(yíng)者更多地了解客戶(hù),為客戶(hù)提供更好的服務(wù)。例如,一些客戶(hù)在一個(gè)時(shí)間段內經(jīng)常瀏覽“wedding celebration”,經(jīng)過(guò)分析可將這些客戶(hù)聚類(lèi)為一組,并可進(jìn)一步得知這是一組即將結婚的客戶(hù),對他們的服務(wù)就應該有別于其他的聚類(lèi)客戶(hù),如“經(jīng)理人員階層組”、“學(xué)生階層組”。這樣,web可自動(dòng)給這個(gè)特定的顧客聚類(lèi)發(fā)送新產(chǎn)品信息郵件,為這個(gè)顧客聚類(lèi)動(dòng)態(tài)地改變一個(gè)特殊的站點(diǎn)。在一定程度上滿(mǎn)足客戶(hù)的要求,這對客戶(hù)和銷(xiāo)售商來(lái)說(shuō)更有意義。
三、web數據挖掘技術(shù)在電子商務(wù)中的應用
1.挽留老顧客,挖掘潛在客戶(hù)
通過(guò)web挖掘,電子商務(wù)的經(jīng)營(yíng)者可以獲知每位訪(fǎng)問(wèn)者的個(gè)人愛(ài)好,充分地了解客戶(hù)的需要,根據每一類(lèi)顧客的獨特需求提供定制化的產(chǎn)品,并根據需求動(dòng)態(tài)地向客戶(hù)做頁(yè)面推薦,調整web頁(yè)面,提高客戶(hù)滿(mǎn)意度,延長(cháng)客戶(hù)駐留的時(shí)間,最終達到留住客戶(hù)的目的。通過(guò)挖掘web日志記錄,可以先對已經(jīng)存在的訪(fǎng)問(wèn)者進(jìn)行分類(lèi),然后從它的分類(lèi)判斷出某個(gè)新客戶(hù)是否是潛在的客戶(hù)。
2.制定產(chǎn)品營(yíng)銷(xiāo)策略,優(yōu)化促銷(xiāo)活動(dòng)
通過(guò)對商品訪(fǎng)問(wèn)情況和銷(xiāo)售情況進(jìn)行挖掘,企業(yè)能夠獲取客戶(hù)的訪(fǎng)問(wèn)規律,確定顧客消費的生命周期,根據市場(chǎng)的變化,針對不同的產(chǎn)品制定相應的營(yíng)銷(xiāo)策略。
3.降低運營(yíng)成本,提高企業(yè)競爭力
電子商務(wù)的經(jīng)營(yíng)者通過(guò)web數據挖掘,可以得到可靠的市場(chǎng)反饋信息,認真分析顧客的將來(lái)行為,進(jìn)行有針對性的電子商務(wù)營(yíng)銷(xiāo)活動(dòng);可以根據關(guān)心某產(chǎn)品的訪(fǎng)問(wèn)者的瀏覽模式來(lái)決定廣告的位置,增加廣告針對性,提高廣告的投資回報率,從而降低運營(yíng)成本,提高企業(yè)競爭力。
4.提高站點(diǎn)點(diǎn)擊率,完善電子商務(wù)網(wǎng)站設計
通過(guò)挖掘客戶(hù)的行為記錄和反饋情況為站點(diǎn)設計者提供改進(jìn)的依據,進(jìn)一步優(yōu)化網(wǎng)站組織結構以提高網(wǎng)站的點(diǎn)擊率。比如利用關(guān)聯(lián)規則的發(fā)現,可以針對不同客戶(hù)動(dòng)態(tài)調整站點(diǎn)結構,使客戶(hù)訪(fǎng)問(wèn)的有關(guān)聯(lián)的文件間的鏈接更直接,讓客戶(hù)容易地訪(fǎng)問(wèn)到想要的頁(yè)面,就能給客戶(hù)留下好的印象,增加下次訪(fǎng)問(wèn)的機率。
同時(shí)對網(wǎng)站上各種數據的統計分析有助于改進(jìn)系統性能,增強系統安全性,并提供決策支持。
四、結束語(yǔ)
當今時(shí)代,電子商務(wù)的發(fā)展勢頭越來(lái)越強勁,面向電子商務(wù)的數據挖掘將是一個(gè)非常有前景的領(lǐng)域。但是,不可否認,在面向電子商務(wù)的數據挖掘中還存在很多急需解決的問(wèn)題, 比如:怎樣將服務(wù)器的日志數據轉化成適合某種數據挖掘技術(shù)的數據格式;怎樣解決分布性、異構性數據源的挖掘問(wèn)題;如何控制整個(gè)web上的知識發(fā)現過(guò)程等。
參考文獻:
[1]jiawei han,micheline kamber著(zhù),范明孟小峰譯:數據挖掘概念與技術(shù).機械工業(yè)出版社,2001,8
[2]凌傳繁:web挖掘技術(shù)在電子商務(wù)中的應用[j].情報雜志,2006,(1)
[3]柳:web挖掘技術(shù)與電子商務(wù)[j].商場(chǎng)現代化,2007,(03x)
【W(wǎng)eb數據挖掘及其在電子商務(wù)中的應用研究論文】相關(guān)文章:
Web數據挖掘技術(shù)在個(gè)性化網(wǎng)絡(luò )教學(xué)中的應用研究08-07
數據挖掘在旅游電子商務(wù)中應用論文08-07
關(guān)于計算機Web數據及其在電子商務(wù)中的應用探析07-28
淺談數據挖掘在電子商務(wù)中的應用10-08
電子商務(wù)中數據挖掘方法淺談08-12
談數據挖掘技術(shù)在電子商務(wù)中的應用10-09
探析電子商務(wù)中數據挖掘方法的應用10-19