- 相關(guān)推薦
探析電子商務(wù)中數據挖掘方法的應用
摘要: 電子商務(wù)是現代商業(yè)的主流趨勢,如何充分利用網(wǎng)絡(luò )技術(shù)和數據庫技術(shù)發(fā)揮企業(yè)優(yōu)勢,成為企業(yè)制勝的法寶。本文介紹了常用的數據挖掘方法,以及在電子商務(wù)領(lǐng)域的應用,分析了利用數據挖掘技術(shù)建設動(dòng)態(tài)、高效電子商務(wù)的可行性。關(guān)鍵詞:數據挖掘 電子商務(wù) 數據庫
一、引言
電子商務(wù)是指以Internet網(wǎng)絡(luò )為載體、利用數字化電子方式開(kāi)展的商務(wù)活動(dòng)。隨著(zhù)網(wǎng)絡(luò )技術(shù)和數據庫技術(shù)的飛速發(fā)展,電子商務(wù)正顯示越來(lái)越強大的生命力。電子商務(wù)的發(fā)展促使公司內部收集了大量的數據,并且迫切需要將這些數據轉換成有用的信息和知識,為公司創(chuàng )造更多潛在的利潤。利用數據挖掘技術(shù)可以有效地幫助企業(yè)分析從網(wǎng)上獲取的大量數據,發(fā)現隱藏在其后的規律性,提取出有效信息,進(jìn)而指導企業(yè)調整營(yíng)銷(xiāo)策略,給客戶(hù)提供動(dòng)態(tài)的個(gè)性化的高效率服務(wù)。
二、數據挖掘技術(shù)
1.數據挖掘
數據挖掘(Data Mining),又稱(chēng)數據庫中的知識發(fā)現(Knowledge Discovery in Database, KDD),是從大量的、不完全的、有噪聲的、模糊的和隨機的數據中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過(guò)程。數據挖掘是一門(mén)廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域尤其是數據庫、人工智能、數理統計、可視化、并行計算等方面的知識。數據挖掘技術(shù)從一開(kāi)始就是面向應用領(lǐng)域,它不僅是面向特定數據庫的簡(jiǎn)單檢索查詢(xún)調用,而且,要對數據進(jìn)行微觀(guān)、中觀(guān)乃至宏觀(guān)的統計、分析、綜合和推理,以指定實(shí)際問(wèn)題的求解,企圖發(fā)現事件間的相互關(guān)聯(lián),甚至利用已有的數據對未來(lái)的活動(dòng)進(jìn)行預測。數據挖掘技術(shù)在金融、保險、電信、大型超市等積累有大量數據的電子商務(wù)行業(yè)有著(zhù)廣泛的應用,如信用分析、風(fēng)險分析、欺詐檢驗、用戶(hù)聚類(lèi)分析、消費者習慣分析等。
2.數據挖掘過(guò)程
挖掘數據過(guò)程可以分為3個(gè)步驟:數據預處理、模式發(fā)現、模式分析。
(1)數據預處理。實(shí)際系統中的數據一般都具有不完全性、冗余性和模糊性。因此,數據挖掘一般不對原始數據進(jìn)行挖掘,要通過(guò)預處理提供準確、簡(jiǎn)潔的數據。預處理主要完成以下工作:包括合并數據,將多個(gè)文件或多個(gè)數據庫中的數據進(jìn)行合并處理;選擇數據,提取出適合分析的數據集合;數據清洗、過(guò)濾,剔除一些無(wú)關(guān)記錄,將文件、圖形、圖像及多媒體等文件轉換成可便于數據挖掘的格式等。
(2)模式發(fā)現。模式發(fā)現階段就是利用挖掘算法挖掘出有效的、新穎的、潛在的、有用的以及最終可以理解的信息和知識?捎糜赪eb的挖掘技術(shù)有路徑選擇、關(guān)聯(lián)分析、分類(lèi)規則、聚類(lèi)分析、序列分析、依賴(lài)性建模等等。
(3)模式分析。模式分析是從模式發(fā)現階段獲得的模式、規則中過(guò)濾掉不感興趣的規則和模式。通過(guò)技術(shù)手段,對得到的模式進(jìn)行數據分析,得出有意義的結論。常用的技術(shù)手段有:關(guān)聯(lián)規則、分類(lèi)、聚類(lèi)、序列模式等。
三、電子商務(wù)中幾種常用的數據挖掘方法
1.關(guān)聯(lián)規則
關(guān)聯(lián)規則是數據挖掘研究的主要模式之一,側重于確定數據中不同領(lǐng)域之間的關(guān)系,找出滿(mǎn)足給定條件下的多個(gè)域間的依賴(lài)關(guān)系。關(guān)聯(lián)規則挖掘對象一般是大型數據庫,該規則一般表示式為:A1∧A2∧…Am=