- 相關(guān)推薦
商業(yè)智能軟件在汽車(chē)銷(xiāo)售中的應用
畢業(yè)論文
[摘要] 本文利用商業(yè)智能軟件IBM DB2 Intelligent Miner建立汽車(chē)市場(chǎng)營(yíng)銷(xiāo)分析的數據倉庫模型,并利用決策樹(shù)分類(lèi)技術(shù),對汽車(chē)銷(xiāo)售企業(yè)的調查問(wèn)卷數據進(jìn)行分析,挖掘出最近1年內有購車(chē)意愿的客戶(hù)的特征。企業(yè)針對這些特征,采取相應營(yíng)銷(xiāo)策略,從而提高營(yíng)銷(xiāo)的針對性和成功率。
[關(guān)鍵詞] 商業(yè)智能軟件 數據挖掘 決策樹(shù)
1、 引言
在激烈的市場(chǎng)競爭環(huán)境中,1個(gè)企業(yè)如果要生存和發(fā)展,就必需了解市場(chǎng),了解客戶(hù),樹(shù)立“以市場(chǎng)為導向,以客戶(hù)為中心”的經(jīng)營(yíng)理念。汽車(chē)銷(xiāo)售企業(yè)作為服務(wù)業(yè)尤其如此,面對瞬息萬(wàn)變的市場(chǎng),多變的客戶(hù),應用信息技術(shù)為營(yíng)銷(xiāo)服務(wù),建立客戶(hù)關(guān)系管理系統等不失為有效途徑。而數據挖掘技術(shù)在客戶(hù)分析方面有優(yōu)勢。在營(yíng)銷(xiāo)過(guò)程中市場(chǎng)調查是10分重要的,市場(chǎng)調查將為營(yíng)銷(xiāo)策略,廣告的投放提供依據,面對市場(chǎng)調查取得的大量紛雜、無(wú)序的數據,利用商業(yè)智能軟件的數據挖掘技術(shù)進(jìn)行處理,將會(huì )起到良好的結果。
2、商業(yè)智能軟件
商業(yè)智能(BI,Business Intelligence),又稱(chēng)商務(wù)智能,就是1種將數據轉變?yōu)樾畔、信息轉變成知識的工具,并且這種工具能夠在恰當的時(shí)候通過(guò)恰當的方式把恰當的信息傳遞給恰當的人。商業(yè)智能定義為下列軟件工具的集合。
1.簡(jiǎn)單的查詢(xún)和報告工具。專(zhuān)門(mén)用來(lái)支持初級用戶(hù)的原始數據訪(fǎng)問(wèn),不包括適用于專(zhuān)業(yè)人士的成品報告生成工具。在這1層次,商業(yè)智能僅僅是把信息進(jìn)行粗加工。
2.在線(xiàn)分析處理。提供多維數據管理環(huán)境,其典型的應用是對商業(yè)問(wèn)題的建模與商業(yè)數據分析。
3.經(jīng)理信息系統。這類(lèi)系統的用戶(hù)希望能夠在不太費力的情況下,從系統中獲取大多數信息。
4.數據集市和數據倉庫產(chǎn)品。包括數據清洗、數據抽取、轉換、載入、數據管理和數據存取等方面的軟件。
5.數據挖掘(Data Mining)軟件。使用諸如決策樹(shù)、神經(jīng)網(wǎng)絡(luò )、規則歸納等技術(shù),用來(lái)發(fā)現數據之間的關(guān)系,做出基于數據的推斷。數據挖掘是通過(guò)仔細分析大量數據來(lái)揭示有意義的新的關(guān)系、模式和趨勢的過(guò)程。它使用模式認知技術(shù)、統計技術(shù)和數學(xué)技術(shù)。 數據挖掘的目的是為決策建模,即根據過(guò)去活動(dòng)的分析預測將來(lái)的行為。比較常見(jiàn)的數據挖掘算法有:聚類(lèi)分析、決策樹(shù)、神經(jīng)網(wǎng)絡(luò )、規則歸納。1般比較好的數據挖掘工具都會(huì )支持這幾種算法。
3、決策樹(shù)與IBM DB2 Intelligent Miner
決策樹(shù)方法起源于概念學(xué)習系統,然后發(fā)展了ID3 方法并達到高峰,最后又演化為能處理連續屬性的C4.5。
決策樹(shù)構造的輸入是1組帶有類(lèi)別標記的數據,構造的結果是1棵2叉或多叉樹(shù)。2叉樹(shù)的內部節點(diǎn)(非葉子節點(diǎn))1般表示為1個(gè)邏輯判斷,如形式為(ai=vi)的邏輯判斷,其中ai是屬性,vi是該屬性的某個(gè)屬性值;樹(shù)的邊是邏輯判斷的分支結果。多叉樹(shù)的內部節點(diǎn)是屬性,邊是該屬性的所有取值,有幾個(gè)屬性值,就有幾條邊。樹(shù)的葉子節點(diǎn)都是類(lèi)別標記。
構造決策樹(shù)的方法是采用自上而下的遞歸構造。以多叉樹(shù)為例,它的構造思路是:如果訓練數據集合中的所有數據是同類(lèi)的,則將之作為葉子節點(diǎn),節點(diǎn)內容即是該類(lèi)別標記,否則,根據某種策略選擇1個(gè)屬性;按照屬性的各個(gè)取值,把數據集合劃分為若干子集合,使得每個(gè)子集上的所有數據在該屬性上具有同樣的屬性值;然后再依次遞歸處理各個(gè)子集。這種思路實(shí)際上就是“分而治之”(Divide-and-conquer)的道理。2叉樹(shù)的原理與此的差別僅在于要選擇1個(gè)好的邏輯判斷。
在生成的決策樹(shù)中可以建立1個(gè)規則基。1個(gè)規則基包含1組規則,每1條規則對應決策樹(shù)的1條不同路徑,這條路徑代表它經(jīng)過(guò)節點(diǎn)所表示的條件的1條連接。
IBM的Intenlligent Miner是市場(chǎng)上最強大和最有可伸縮性的工具之1,正在競爭數據挖掘工具市場(chǎng)的領(lǐng)導地位,它提供了最廣泛的數據挖掘技術(shù)和算法,在數據規模和計算性能方面具有非常高的可伸縮性;Intellligent Miner支持分類(lèi)、預測、關(guān)聯(lián)規則、聚類(lèi)、順序模式偵測和時(shí)間序列分析的算法。Intenlligent Miner支持DB2關(guān)系數據庫管理系統,并集成了大量復雜的數據操縱函數。
根據IDC的統計,Intelligent Miner目前是數據挖掘領(lǐng)域最先進(jìn)的產(chǎn)品。大多數算法是由IBM研究所研發(fā)出的,是IBM的專(zhuān)有技術(shù),并只存在于Intelligent Miner中。決策樹(shù)使用的是CAU算法的2種變種,用以產(chǎn)生1個(gè)分類(lèi)模型并且能夠處理離散和連續數據。
4、決策樹(shù)技術(shù)在汽車(chē)銷(xiāo)售中的應用
下面將就某汽車(chē)銷(xiāo)售公司,在汽車(chē)展上的調查問(wèn)卷進(jìn)行分析。潛在客戶(hù)的數據主要有年齡、性別、職業(yè)、收入、教育程度、是否結婚,是否有房等,調查客戶(hù)是否會(huì )在1年內買(mǎi)車(chē)。數據表格式如下:
數據清洗試圖填補訓練集中的空缺值、識別孤立點(diǎn)、消除噪聲、糾正數據中的不1致。對于空缺值的處理,通常有忽略元組、人工填寫(xiě)空缺值、使用全局常量填充、使用屬性平均值填充、使用與給定元組同1類(lèi)的樣本平均值填充、使用最可能的值填充等方法。
調查問(wèn)卷中,有部分沒(méi)有填寫(xiě)的選項,如年齡屬性,對于這1部分記錄采用的是使用屬性平均值填充的方法。
在進(jìn)行數據挖掘工作之前,需要進(jìn)行前期的數據整理工作,比如根據直觀(guān)經(jīng)驗去除數據中的冗余信息或不相關(guān)信息,對于上面的數據集中的屬性,像序號等,可以在正式開(kāi)始數據挖掘前去除,因為客戶(hù)是否近期內買(mǎi)車(chē)是我們最關(guān)心的信息,我們把屬性“是否1年內買(mǎi)車(chē)”即buy作為類(lèi)標簽屬性。
2.生成決策樹(shù),產(chǎn)生規則。整理后的數據導入到DB2關(guān)系數據庫表中,使用IBM的Inten1igent Miner提供的數據挖掘工具生成決策樹(shù),并剪枝后如下圖。
在得到?jīng)Q策樹(shù)之后,可以由其中提取分類(lèi)規則,在該例中,可以提取的規則如下:If Salary =2750~6500 and age=31.5~40.5then buy=y。
也就是說(shuō),在剪去1些噪聲枝節之后,在決策樹(shù)的每1條支路上,都可以形成1條分類(lèi)規則?梢圆捎眠@些分類(lèi)規則,對潛在的客戶(hù)數據進(jìn)行分類(lèi),由此得出哪些客戶(hù)最近有購車(chē)的意愿,然后可以主動(dòng)地向客戶(hù)推銷(xiāo)汽車(chē),并且給予1定的優(yōu)惠政策,由被動(dòng)營(yíng)銷(xiāo)轉變?yōu)橹鲃?dòng)營(yíng)銷(xiāo)。
3.決策樹(shù)結果分析理解。需要說(shuō)明的是這203份問(wèn)卷是在車(chē)展中獲取的,來(lái)參加車(chē)展接受問(wèn)卷調查的自然多數是有買(mǎi)車(chē)想法的,因此31.2%愿意買(mǎi)車(chē),這個(gè)比例在普通人群中是達不到的。下面我們從產(chǎn)生的決策樹(shù)規則分析1下是否在1年內買(mǎi)車(chē)與客戶(hù)的因素之間的關(guān)系。
(1)收入直接決定了1個(gè)人的購買(mǎi)力。salary即月薪在低于2550元的客戶(hù)中,汽車(chē)是奢侈品,在近期1年內沒(méi)有購車(chē)的意愿;月薪在高于6500元的客戶(hù)中,1年內也沒(méi)有購車(chē)的意愿,可以想象高收入人群大多已經(jīng)有車(chē)了。
(2)年齡也是導致買(mǎi)車(chē)的1個(gè)因素。在接受調查的人群中都在22歲~65歲之間。年輕人中愿意買(mǎi)車(chē)的較多,年齡小于31.5歲的人,可能是由于婚姻與購房所困,1年內沒(méi)有購車(chē)的意愿;年齡在31.5歲~40.5歲之間(占82.3%),1般來(lái)說(shuō)這1部分高收入人群不受房子與婚姻狀況所困擾,孩子大多在上中小學(xué),而目前大多數是獨生子女,社會(huì )治安又不太好,在經(jīng)濟條件許可的情況,會(huì )考慮買(mǎi)車(chē)來(lái)接送孩子。因此有近期買(mǎi)車(chē)的打算。
(3)愿意買(mǎi)車(chē)的多為男性。在低收入的女性中沒(méi)有考慮購車(chē)問(wèn)題,但男性如果收入還可以的情況下有近期買(mǎi)車(chē)的可能性。
(4)從目前這些數據來(lái)看,受教育情況、婚否、工作性質(zhì)與是否愿意近期買(mǎi)車(chē)影響也不大。
客戶(hù)的購買(mǎi)行為還要從多方面進(jìn)行考慮,我們僅從這幾方面挖掘出外部環(huán)境與客戶(hù)的購買(mǎi)行為之間的關(guān)系。在計劃購車(chē)的人群中,購車(chē)的價(jià)位,車(chē)的排氣量、車(chē)的顏色等也可以進(jìn)行挖掘;在不打算購車(chē)的人群中,不買(mǎi)的原因,也值得分析。
5、結論
采用決策樹(shù)分類(lèi)算法,通過(guò)對調查數據挖掘,得到1系列的分類(lèi)規則,然后利用此分類(lèi)規則,對潛在客戶(hù)進(jìn)行分析,采取主動(dòng)營(yíng)銷(xiāo),可以降低營(yíng)銷(xiāo)成本,從而可以提高營(yíng)銷(xiāo)的成功率。隨著(zhù)多方面大量數據的獲得,商業(yè)智能的數據挖掘工具可以挖掘出更有參考價(jià)值、易于理解,并具有很高的分類(lèi)準確度的規則為生產(chǎn)實(shí)踐服務(wù)。決策樹(shù)數據挖掘技術(shù)在汽車(chē)銷(xiāo)售中也有著(zhù)廣闊的應用前景,值得我們進(jìn)1步的研究。
參考文獻:
[1]鄭曉紅:商業(yè)智能提升管理信息化[J].商場(chǎng)現代化,2005,(12)
[2]羅海蛟劉顯:數據挖掘中分類(lèi)算法的研究及其應用[J].微機發(fā)展,2003,6
[3]白菲孟超英:數據挖掘技術(shù)在高校人事信息建設中的應用[J].教育信息化,2005,(09)
[4]譚旭王麗珍卓明:利用決策樹(shù)挖掘分類(lèi)規則的算法研究[J].云南大學(xué)學(xué)報,2002,6,415~419
[5]潘珩:汽車(chē)營(yíng)銷(xiāo)決策支持系統數據倉庫的設計與實(shí)現[J]. 石河子大學(xué)學(xué)報(自然科學(xué)版),2005,(05)
【商業(yè)智能軟件在汽車(chē)銷(xiāo)售中的應用】相關(guān)文章:
淺析商業(yè)智能在稅收管理中的應用03-24
LonWorks及其在智能小區中的應用03-21
ZigBee在智能照明中的應用研究03-07
紅外遙控在汽車(chē)中的應用03-19
綜合智能控制技術(shù)在電網(wǎng)規劃中的應用03-26
探析代理記賬中商品軟件的應用03-17
iFIX軟件在計算機中的應用03-18
漢語(yǔ)分詞在中文軟件中的廣泛應用03-18