- 相關(guān)推薦
基于自組織數據挖掘區域物流需求預測論文
摘要:
文章將自組織數據挖掘方法應用于區域物流需求預測,建立了參數GMDH輸入輸出模型和非參數模糊規則歸納區域物流需求預測模型,鑒于單個(gè)模型預測的局限性,以最小二乘法為最優(yōu)化準則,建立了最優(yōu)線(xiàn)性組合預測模型。實(shí)證分析表明組合預測結果比較滿(mǎn)意,自組織數據挖掘方法是區域物流需求預測的有效工具。
關(guān)鍵詞:區域物流;物流需求;GMDH;組合預測
引言:
區域物流預測的研究始于上世紀90年代,我國學(xué)者對于物流需求預測的研究開(kāi)始于本世紀初。由于區域物流概念從國外引入的時(shí)間不長(cháng),因此缺乏統一的標準,統計數據很不全面,很多區域物流統計數據沒(méi)有能夠全面反映物流需求量的指標。目前物流需求的量度大多通過(guò)實(shí)物量或價(jià)值量?jì)煞N度量體系來(lái)獲得,實(shí)物量主要有貨運量、存貨量、加工量、配送量等,價(jià)值量則是反映所有物流環(huán)節的全部服務(wù)的價(jià)值構成。大多數學(xué)者[1—3]在研究過(guò)程中用貨運量來(lái)替代物流需求量,也有學(xué)者認為利用貨運量這一類(lèi)的實(shí)物量不能如實(shí)反映物流需求。另外,目前物流需求預測的研究方法主要有統計學(xué)方法和人工智能方法[4]。統計學(xué)方法主要有投入產(chǎn)出模型、回歸分析、灰色理論模型和馬爾科夫鏈等,例如黃虎[5]通過(guò)構建了主成分—SVR的“影響因素—區域物流需求”模型,對上海物流需求進(jìn)行預測,取得了良好的效果。人工智能方法主要有:人工神經(jīng)網(wǎng)絡(luò )及其改進(jìn)算法,林榮天[6]等建立了區域物流需求的BP神經(jīng)網(wǎng)絡(luò )模型,較好的擬合了區域經(jīng)濟與區域物流之間的非線(xiàn)性關(guān)系。
上述方法在模型可解釋性和學(xué)習樣本數量方面存在一定的局限性,而自組織數據挖掘在復雜系統的模擬和預測方面有著(zhù)獨特的優(yōu)勢,所以論文將自組織數據挖掘技術(shù)應用到區域物流需求預測中。從投入產(chǎn)出的角度,選擇交通運輸、倉儲和郵政業(yè)產(chǎn)值來(lái)代表物流需求,主要是考慮到它可以大致代表物流供給量,在供需平衡的情況的下,其數值也代表物流需求量。首先分別建立了參數GMDH輸入輸出模型和非參數模糊規則歸納模型,得到單模型的預測結果,然后利用最優(yōu)線(xiàn)性組合建立了組合預測模型,得到更為理想的組合預測結果,最后對預測結果進(jìn)行了分析。
一、模型介紹。
1、自組織數據挖掘。
最早的自組織數據挖掘的思想由烏克蘭科學(xué)院A.G.I—vakhnenko院士于1967年提出,經(jīng)過(guò)不斷發(fā)展,如今在復雜系統的模擬、預測等方面,成為輔助人們進(jìn)行系統分析和決策的有力工具。自組織數據挖掘是建立在“進(jìn)化—遺傳—變異—選擇”的進(jìn)化論原理基礎上的,其建模方法體現了由簡(jiǎn)單到復雜的事物演化過(guò)程,是基于復雜系統的前沿科學(xué)。
利用自組織數據挖掘理論建立復雜系統動(dòng)態(tài)模型時(shí),根據因變量及自變量樣本數據,在計算機上采用人機對話(huà)方式產(chǎn)生大量競爭模型,再根據外準則選擇一部分“最有希望”的模型,在利用這些模型產(chǎn)生大批新的競爭模型。按這樣的方式將模型的結構從簡(jiǎn)單到復雜逐步改進(jìn),最后選擇出最優(yōu)的復雜模型來(lái)。自組織算法的外準則是基于某些補充信息,即是在估計模型參數時(shí)沒(méi)有使用過(guò)的信息。使用外準則篩選競爭模型,是自組織數據挖掘算法的特色[7]。
GMDH(Group Method of Data Handling)是自組織數據挖掘的核心技術(shù)。具體來(lái)說(shuō)包括以下四類(lèi)模型:
。1)參數GMDH輸入輸出模型。
。2)參數GMDH自回歸模型。
。3)非參數相似合成模型。
。4)非參數模糊規則歸納模型。
論文選擇的是參數GMDH輸入輸出模型和非參數模糊規則歸納模型。
參數GMDH輸入輸出模型能夠自動(dòng)篩選進(jìn)入模型的自變量,因此常用于復雜系統的關(guān)鍵變量提取。這也符合物流需求預測的需要。同時(shí),該模型允許變量延遲,可以直接利用建立的模型進(jìn)行預測。非參數模糊規則歸納模型使用黑箱方法分析處理系統輸入、輸出變量之間的關(guān)系,運用GMDH技術(shù),能夠客觀(guān)地從系統所有可能的模糊規則中產(chǎn)生關(guān)于系統的最優(yōu)模糊規則。因此它的最大優(yōu)勢是可以比較直觀(guān)有效地描述模糊系統,是定性與定量的結合[8]。
2、組合預測。
所謂組合預測,就是將不同的預測方法進(jìn)行適當的組合,綜合利用各種方法所提供的有用信息,從而盡可能的提高預測精度。論文根據參數GMDH輸入輸出模型和非參數模糊規則歸納模型的預測結果,建立了最優(yōu)線(xiàn)性組合預測模型得到最終預測值,即:Y=b0+b1Y參數GMDH+b2Y參數GMDH(1)其中b0、b1、b2通過(guò)最小二乘法估計得到。
二、實(shí)證研究。
論文通過(guò)對成都物流需求預測來(lái)進(jìn)行實(shí)證研究。由于物流需求與區域經(jīng)濟發(fā)展存在著(zhù)很大的相關(guān)關(guān)系,所以論文選擇利用區域經(jīng)濟指標對區域物流需求進(jìn)行預測,而不是直接利用物流數據本身。影響區域物流需求的因素從宏觀(guān)上考慮主要有四個(gè):區域經(jīng)濟規模、產(chǎn)業(yè)結構、經(jīng)濟空間布局和區域行業(yè)因素。根據文獻[9]、[10]、[11],結合成都實(shí)際情況和自組織數據挖掘能夠自動(dòng)篩選進(jìn)入模型的自變量的特點(diǎn),選擇以下指標作為影響物流需求的自變量:本地生產(chǎn)總值X1(萬(wàn)元)、固定資產(chǎn)投資總額X2(萬(wàn)元)、第一產(chǎn)業(yè)增加值X3(萬(wàn)元)、第二產(chǎn)業(yè)增加值X4(萬(wàn)元)、第三產(chǎn)業(yè)增加值X5(萬(wàn)元)、貨物發(fā)送量X6(萬(wàn)噸)、貨物周轉量X7(億噸公里)、區域零售總額X8(萬(wàn)元)、人均消費水平X9(元)、區域外貿總額X10(億美元)。選取指標交通運輸、倉儲和郵政業(yè)產(chǎn)值Y(萬(wàn)元)來(lái)代表物流需求。
論文利用成都市1985——2008年的數據作為預測模型的原始數據,其中1985——2005年的數據用作擬合模型,用2006——2008年的數據做模型檢驗。
數據來(lái)自成都市統計年鑒。
1、參數GMDH輸入輸出模型預測。
利用Knowledge Miner軟件建立參數GMDH輸入輸出模型,根據多次試驗和檢驗,發(fā)現當選擇最大時(shí)滯為3的線(xiàn)性模型時(shí)結果最理想。具體模型如下:Y參數GMDH=—0.0078X4(t—3)+0.0978X5—125.3969X7(t—1)+23.6988X9(t—1)+36392.9460(2)由上式可知進(jìn)入模型的自變量有:第二產(chǎn)業(yè)增加值X4(萬(wàn)元)、第三產(chǎn)業(yè)增加值X5(萬(wàn)元)、貨物周轉量X7(億噸公里)、人均消費水平X9(元).Adjusted R—squared值為0.998。
2、非參數模糊規則歸納。
模型預測利用Knowledge Miner軟件建立非參數模糊規則歸納模型,根據多次試驗和檢驗,發(fā)現當選擇最大時(shí)滯為12時(shí)模型結果最理想。由于非參數模糊規則歸納模型使用黑箱方法分析處理系統輸入、輸出變量之間的關(guān)系,所以無(wú)法得到具體模型形式,但根據模型輸出結果可知入選的變量為交通運輸、倉儲和郵政業(yè)產(chǎn)值Y(t—1),第一產(chǎn)業(yè)增加值X3(t—3),區域零售總額X8(t—12)。
3、組合預測。
利用參數GMDH輸入輸出模型和非參數模糊規則歸納模型的預測結果和模擬值,建立的最優(yōu)線(xiàn)性組合預測模型如下:Y=—3380.323+1.142Y參數GMDH—0.14Y非參數GMDH(3)其中,Adjusted R—squared值為0.998。
4、結果分析。
參數GMDH輸入輸出模型、非參數模糊規則歸納模型及組合預測模型的預測結果。參數GMDH輸入輸出模型平均絕對誤差是1.66%,相對誤差最大為3.37%。非參數模糊規則歸納模型的平均絕對誤差是3.65%,相對誤差最大為7.55%,超過(guò)了5%,誤差比較大。所以,參數GMDH輸入輸出模型的預測效果要好于非參數模糊規則歸納模型。組合預測模型平均絕對誤差為1.42%,相對誤差最大為2.67%。即平均絕對誤差及最大相對誤差均小于單個(gè)模型,總體來(lái)說(shuō)預測結果要優(yōu)于兩個(gè)單個(gè)模型,得到的預測結果相對比較滿(mǎn)意、可靠。
三、結語(yǔ)。
論文討論了參數GMDH輸入輸出模型和非參數模糊規則歸納模型在區域物流需求預測中的應用,針對兩種預測模型建立了最優(yōu)線(xiàn)性組合預測模型,實(shí)證表明組合預測模型的預測結果是比較準確,自組織數據挖掘可以作為區域物流需求預測的有效工具。未來(lái)可以在提高模型的預測精度和可解釋性方面做進(jìn)一步研究,另外,在組合預測方面,最優(yōu)準則一般為“誤差平方和最小”、“誤差的絕對值之和最小”等,可以進(jìn)一步研究不同的最優(yōu)準則,更好地發(fā)揮組合預測的優(yōu)勢。
【基于自組織數據挖掘區域物流需求預測論文】相關(guān)文章:
基于數據挖掘技術(shù)的現代物流管理06-25
基于聚類(lèi)分析的數據挖掘方法06-27
基于數據挖掘的成績(jì)分析系統10-10
基于數據挖掘技術(shù)的交叉銷(xiāo)售分析09-27
基于數據挖掘的網(wǎng)絡(luò )入侵檢測技術(shù)05-16
基于數據挖掘的差異化車(chē)險收入管理研究論文10-17
數據挖掘的論文參考文獻10-14
數據挖掘論文參考文獻09-16
基于愛(ài)好的電子商務(wù)數據挖掘技術(shù)的研究06-13
關(guān)于數據挖掘論文參考文獻06-11