- 相關(guān)推薦
在電子商務(wù)中如何正確的使用數據挖掘技術(shù)
摘要:對于企業(yè)而言,數據挖掘有助于發(fā)現業(yè)務(wù)發(fā)展的趨勢,幫助企業(yè)做出正確的決策,使企業(yè)處于更有利的競爭位置。數據挖掘中應用的技術(shù)包括經(jīng)典的統計、近鄰、聚類(lèi),也包括最新發(fā)展起來(lái)的決策樹(shù)、神經(jīng)網(wǎng)絡(luò )和關(guān)聯(lián)規則等一些較新的方法。當實(shí)際開(kāi)發(fā)一個(gè)數據挖掘系統時(shí),究竟應該選擇哪種數據挖掘技術(shù),往往是一件很困難的事情。本文結合數據挖掘技術(shù)在電子商務(wù)中的應用,提出選擇數據挖掘技術(shù)的兩個(gè)重要依據,以便開(kāi)發(fā)出有效、實(shí)用的數據挖掘系統。
關(guān)鍵詞:數據挖掘 電子商務(wù) 關(guān)聯(lián)分析 分類(lèi) 聚類(lèi)
1引言
隨著(zhù)網(wǎng)絡(luò )技術(shù)和數據庫技術(shù)的成熟,全球傳統商務(wù)正經(jīng)歷一次重大變革,向電子商務(wù)全速挺進(jìn)。這種商業(yè)電子化的趨勢不僅為客戶(hù)提供了便利的交易方式和廣泛的選擇,同時(shí)也為商家提供了更加深入地了解客戶(hù)需求信息和購物行為特征的可能性。數據挖掘技術(shù)作為電子商務(wù)的重要應用技術(shù)之一,將為正確的商業(yè)決策提供強有力的支持和可靠的保證,是電子商務(wù)不可缺少的重要工具。
電子商務(wù)的發(fā)展促使公司內部收集了大量的數據,并且迫切需要將這些數據轉換成有用的信息和知識,為公司創(chuàng )造更多潛在的利潤,數據挖掘概念就是從這樣的商業(yè)角度開(kāi)發(fā)出來(lái)的。數據挖掘涉及的學(xué)科領(lǐng)域和方法很多,其核心技術(shù)歷經(jīng)了數十年的發(fā)展,其中包括統計、近鄰、聚類(lèi)、決策樹(shù)、神經(jīng)網(wǎng)絡(luò )和規則等。今天,這些成熟的技術(shù)在電子商務(wù)中已進(jìn)入了實(shí)用階段,并取得了良好的效果。但數據挖掘作為一個(gè)新興領(lǐng)域,在實(shí)際應用當中仍存在許多尚未解決的問(wèn)題。其中最困難的往往在于決定什么時(shí)候采用哪種數據挖掘技術(shù)。為了對數據挖掘技術(shù)進(jìn)行明智的選擇,本文結合數據挖掘技術(shù)在電子商務(wù)中的應用,從挖掘任務(wù)和數據信息兩個(gè)角度進(jìn)行分析,指出各種數據挖掘技術(shù)適用的場(chǎng)合,以便開(kāi)發(fā)出切實(shí)可用的數據挖掘系統。
2數據挖掘的概念及其在電子商務(wù)中的應用
2.1數據挖掘的概念
數據挖掘是通過(guò)挖掘數據倉庫中存儲的大量數據,從中發(fā)現有意義的新的關(guān)聯(lián)模式和趨勢的過(guò)程。從商業(yè)的角度定義,數據挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點(diǎn)是對商業(yè)數據庫中的大量業(yè)務(wù)數據進(jìn)行抽取、轉換、分析和其它模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數據。數據挖掘最吸引人的地方是它能建立預測模型而不是回顧型的模型。利用功能強大的數據挖掘技術(shù),可以使企業(yè)把數據轉化為有用的信息幫助決策,從而在市場(chǎng)競爭中獲得優(yōu)勢地位。
2.2數據挖掘在電子商務(wù)中的應用
由于數據挖掘能帶來(lái)顯著(zhù)的經(jīng)濟效益,它在電子商務(wù)中(特別是金融業(yè)、零售業(yè)和電信業(yè))應用也越來(lái)越廣泛。
在金融領(lǐng)域,管理者可以通過(guò)對客戶(hù)償還能力以及信用的分析,進(jìn)行分類(lèi),評出等級。從而可減少放貸的麻木性,提高資金的使用效率。同時(shí)還可發(fā)現在償還中起決定作用的主導因素,從而制定相應的金融政策。更值得一提的是通過(guò)對數據的分析還可發(fā)現洗黑錢(qián)以及其它的犯罪活動(dòng)。
在零售業(yè),數據挖掘可有助于識別顧客購買(mǎi)行為,發(fā)現顧客購買(mǎi)模式和趨勢,改進(jìn)服務(wù)質(zhì)量,取得更好的顧客保持力和滿(mǎn)意程度,提高貨品銷(xiāo)量比率,設計更好的貨品運輸與分銷(xiāo)策略,減少商業(yè)成本。
電信業(yè)已經(jīng)迅速地從單純的提供市話(huà)和長(cháng)話(huà)服務(wù)演變?yōu)榫C合電信服務(wù),如語(yǔ)音、傳真、尋呼、移動(dòng)電話(huà)、圖像、電子郵件、計算機和WEB數據傳輸以及其它的數據通信服務(wù)。電信、計算機網(wǎng)絡(luò )、因特網(wǎng)和各種其它方式的通信和計算的融合是目前的大勢所趨。而且隨著(zhù)許多國家對電信業(yè)的開(kāi)放和新型計算與通信技術(shù)的發(fā)展,電信市場(chǎng)正在迅速擴張并越發(fā)競爭激烈。因此,利用數據挖掘技術(shù)來(lái)幫助理解商業(yè)行為、確定電信模式、捕捉盜用行為、更好的利用資源和提高服務(wù)質(zhì)量是非常有必要的。分析人員可以對呼叫源、呼叫目標、呼叫量和每天使用模式等信息進(jìn)行分析,還可以通過(guò)挖掘進(jìn)行盜用模式分析和異常模式識別,從而可盡早發(fā)現盜用,為公司減少損失。
3選擇數據挖掘技術(shù)的兩個(gè)重要依據
數據挖掘使用的技術(shù)很多,其中主要包括統計方法、機器學(xué)習方法、和神經(jīng)網(wǎng)絡(luò )方法和數據庫方法。統計方法可細分為回歸分析、判別分析、聚類(lèi)分析、探索性分析等。機器學(xué)習方法可細分為歸納學(xué)習方法(決策樹(shù)、規則歸納)、基于范例學(xué)習、遺傳算法等。神經(jīng)網(wǎng)絡(luò )方法可細分為錢(qián)箱神經(jīng)網(wǎng)絡(luò )(BP算法)、自組織神經(jīng)網(wǎng)絡(luò )等。數據庫方法主要是多維數據分析或OLAP方法,另外還有面向屬性的歸納方法。由于每一種數據挖掘技術(shù)都有其自身的特點(diǎn)和實(shí)現的步驟,對數據的形式有具體的要求,并且與具體的應用問(wèn)題密切相關(guān),因此成功的應用數據挖掘技術(shù)以達到目標過(guò)程本身就是一件很復雜的事情,本文主要從挖掘任務(wù)和可獲得的數據兩個(gè)角度來(lái)討論對數據挖掘技術(shù)的選擇。
3.1不同的挖掘任務(wù)使用不同的挖掘技術(shù)
數據挖掘的任務(wù)是從數據中發(fā)現模式。根據挖掘任務(wù),數據挖掘可分為概念描述、聚集發(fā)現、關(guān)聯(lián)規則發(fā)現、分類(lèi)發(fā)現、回歸發(fā)現和序列模式發(fā)現等。在選擇使用某種數據挖掘技術(shù)之前,首先要將待解決的商業(yè)問(wèn)題轉化成正確的數據挖掘的任務(wù),然后根據挖掘的任務(wù)來(lái)選擇具體使用某一種或幾種挖掘技術(shù)。下面具體的分析每一種挖掘任務(wù)應使用哪些挖掘技術(shù)。
概念描述
概念描述是描述式數據挖掘的最基本形式。它以簡(jiǎn)潔匯總的形式描述給定的任務(wù)相關(guān)數據集,提供數據的有趣的一般特性。概念描述由特征化和比較組成。數據特征化是目標類(lèi)數據的一般特征或特性的匯總。通常,用戶(hù)指定類(lèi)的數據通過(guò)數據庫查詢(xún)收集。例如,為研究上一年銷(xiāo)售增加10%的軟件產(chǎn)品的特征,可以通過(guò)執行一個(gè)SQL查詢(xún)收集關(guān)于這些產(chǎn)品的數據。概念的特征化有兩種一般方法:基于數據立方體OLAP的方法和面向屬性歸納的方法。二者都是基于屬性或維的概化方法.數據特征的輸出可以用多種形式提供。包括餅圖、條圖、曲線(xiàn)、多維數據立方體和包括交叉表在內的多維表。數據區分是將目標類(lèi)對象的一般特征與一個(gè)或多個(gè)對比類(lèi)對象的一般特征比較。例如,將上一年銷(xiāo)售增加10%的軟件產(chǎn)品與同一時(shí)期銷(xiāo)售至少下降30%的那些產(chǎn)品進(jìn)行比較。用于數據區分的方法與用于數據特征化的方法類(lèi)似?傊,進(jìn)行概念描述挖掘時(shí)一般采用面向數據庫的方法,另外還可以采用機器學(xué)習方法的基于范例學(xué)習技術(shù)。與機器學(xué)習方法相比,面向數據庫的概念描述導致在大型數據庫和數據倉庫中的有效性和可伸縮性。
聚集發(fā)現
聚集是把整個(gè)數據庫分成不
【在電子商務(wù)中如何正確的使用數據挖掘技術(shù)】相關(guān)文章:
談數據挖掘技術(shù)在電子商務(wù)中的應用03-21
數據挖掘技術(shù)在電子商務(wù)網(wǎng)站中的應用03-28
數據挖掘技術(shù)在CRM中的應用03-22
電子商務(wù)中數據挖掘方法淺談03-01
數據挖掘技術(shù)在飯店營(yíng)銷(xiāo)中的運用03-28
淺析數據庫管理系統中模糊查詢(xún)技術(shù)的正確使用03-04
數據挖掘在旅游電子商務(wù)中應用論文11-28