激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频

數據挖掘在股票估價(jià)的運用

時(shí)間:2024-10-28 18:27:13 金融保險 我要投稿

數據挖掘在股票估價(jià)的運用

  股票價(jià)格受到多種因素影響,具有復雜非線(xiàn)性變化特點(diǎn),單一預測方法只難反映其片斷信息,預測精度低。那么,在股票估價(jià)中如何運用數據挖掘呢?

  1引言

  隨著(zhù)經(jīng)濟的迅速發(fā)展,股票交易市場(chǎng)成為人們投資理財的一種重要途徑,然而受到多種影響,是一種高風(fēng)險、高回報投資方式,為了獲得更多的利潤,必須對股票價(jià)格的波動(dòng)和發(fā)展趨勢準確的把握,因此股標價(jià)格的預測成為經(jīng)濟領(lǐng)域中的一個(gè)重要研究課題[1]。

  股票價(jià)格預測是指通過(guò)對歷史和當天股票價(jià)格進(jìn)行分析和研究,對將來(lái)股票的價(jià)格進(jìn)行預測。發(fā)達國家對股票價(jià)格預測問(wèn)題研究比較成熟,發(fā)達國家股票市場(chǎng)比較穩定、正規,具有非常好的統計規律,而我國股票交易市場(chǎng)剛起步不久,受人為影響、政治、經(jīng)濟影響比較,還起于發(fā)展初期,遠不成熟,沒(méi)有明顯統計規律,采用國外股票價(jià)格預測技術(shù)對我國股票價(jià)格進(jìn)行預測,獲得結果不可靠,誤差比較大,容易給投資起到誤導作用,沒(méi)有什么參考和指導價(jià)值[3]。在國內,自從有了股票交易市場(chǎng)以來(lái),就引起國內大量學(xué)者廣泛關(guān)注,提出一些股票預測方法,常用的方法有線(xiàn)性回歸、時(shí)間序列分析、灰色預測算法等[4-6]。其中的時(shí)間序列分析中一維自回模型(ARIMA最為靈活,使用最為廣泛,但是基于線(xiàn)性建模,股票是一種非線(xiàn)性、時(shí)變的時(shí)間序列數據,預測精度有待進(jìn)一步提高[7]。近幾年,隨著(zhù)數據挖掘技術(shù)發(fā)展,出現神經(jīng)網(wǎng)絡(luò )、支持向量機等智能機器學(xué)習方法,為股票預測拓展了新的研究空間,并在股票市場(chǎng)中得到了廣泛的應用。股票價(jià)格受多種因素影響,變化十分復雜,其一種預測模型只能反映其部分信息,難以全面挖掘股票價(jià)格數據中隱藏的變化規律,預測結果與股民、投資人的要求有一定的差距[8]。

  為了進(jìn)一步提高股票價(jià)格預測精度,更好為股民、投資人提供有價(jià)格的參考信息,提出一種基于數據挖掘的股票價(jià)格組合預測模型。首先采用線(xiàn)性預測模型ARIMA對股票價(jià)格進(jìn)行預測,然后采用智能學(xué)習算法—最小二乘支持向量機(LS-SVM)對股票價(jià)格非線(xiàn)線(xiàn)部分進(jìn)行預測,最后將兩模型的預測值融合成股票價(jià)格的預測值。

  2股票價(jià)格的預測原理

  股票價(jià)格變化受到企業(yè)經(jīng)營(yíng)狀況、國家政策、經(jīng)濟發(fā)展狀況、股民、投資人等因素影響,是一個(gè)動(dòng)態(tài)、非線(xiàn)性、時(shí)變的復雜系統,具有一定的規律性,但同時(shí)具有顯著(zhù)的隨機性,導致股價(jià)格漲跌幅度較大。股票價(jià)格量數學(xué)模型可以表示為:(略)。

  根據式(1)可知,如果采用單一的線(xiàn)性ARIMA模型或非線(xiàn)性L(fǎng)SSSVM模型只能預測趨勢部分或非線(xiàn)線(xiàn)部分,均只能反映股票價(jià)格的部分信息,不能全面反映股票價(jià)格變化規律,采用單一的ARIMA或LSSSVM模型,得到預測結果不可靠,且預測精度低。為了解決單一模型預測精度的低,無(wú)法反映股票價(jià)格動(dòng)態(tài)、非線(xiàn)性、時(shí)變等變化規律,將ARIMA和LSSVM模型組合在一起,對股票價(jià)格進(jìn)行預測,以提高股票價(jià)格預測精度,因此基于數據挖掘的股票價(jià)格組合模型預測原如圖1所示。

  3數據挖掘的股票價(jià)格預測模型

  3.1股票價(jià)格的預處理

  股票價(jià)格歷史數據是一種非平穩數據,漲跌幅度比較大,因此最小值和最大值相差比較大,這會(huì )對股票價(jià)格預測模型訓練速度產(chǎn)生不利影響,為消除這種不利因素,對股票價(jià)格歷史數據進(jìn)行預處理,使其范圍縮放到[0.10.9],具體為:(略)。

  3.2股票價(jià)格的線(xiàn)性預測模型

  設股票價(jià)格歷史數據為:{xt},t=1,2,…n,ARIMA建模過(guò)程為:

  1)由于股標是一種非平穩時(shí)間序列,首先對它進(jìn)行差分處理,即:(略)。

  經(jīng)過(guò)多次差分后,股票價(jià)格數據變成是一種平穩時(shí)間序列,即可以得到:(略)。

  那么股票價(jià)格的ARIMA(p,q,d)模型為:(略)。

  2)模型識別。p、q是ARIMA建模的關(guān)鍵,首先采用自相關(guān)和偏自相關(guān)圖來(lái)決定p、q可能的取值,然后采用最小信息準則(AIC)和相合性準則(SBC)確定出最佳的模型階數。AIC和SBC函數定義為:(略)。

  3)參數估計和模型診斷。模型中所有參數采用極大似然估計得到,然后對參數在模型中進(jìn)行檢驗,對其合理性進(jìn)行判定,如果不適合就重新估計參數。

  4)采用最合參數建立股票價(jià)格預測模型。本文采用浙江大學(xué)DPS6.5軟件包的ARIMA模塊實(shí)現股票價(jià)格整個(gè)建模過(guò)程。

  3.3股票價(jià)格的非線(xiàn)性預測模型

  對于股票價(jià)格時(shí)間序列{xt},t=1,2,…n,由于LSSVM不能對一維時(shí)間序列進(jìn)行直接預測,因此本文通過(guò)拓階方式將一維股票價(jià)格時(shí)間序列轉換成為多維時(shí)間序列{(xi,yi)},i=1,2,…k,xi和yi分別表示樣本輸入和輸出,xi∈Rn,yi∈R,通過(guò)非線(xiàn)性映射函數φ(•)將樣本映射到高維特征空間,從而獲得最優(yōu)線(xiàn)性回歸函數:(略)。

  根據結構風(fēng)險最小化原則,式(9)問(wèn)題求解的LSSVM回歸模型為:(略)。

  通過(guò)引入拉格朗日乘子將上述約束優(yōu)化問(wèn)題轉變?yōu)闊o(wú)約束對偶空間優(yōu)化問(wèn)題,即:(略)。

  選擇徑向基核函數作為L(cháng)SSVM核函數,最后得到股票價(jià)格的LSSVM預測模型為:(略)。

  3.4股票價(jià)格的組合預測步驟

  1)收集某支股票價(jià)格的歷史數據。2)對股票價(jià)格原始歷史數據進(jìn)行預處理,將其值縮放到0.1到0.9之間。3)采用ARIMA模型對股票價(jià)格線(xiàn)性變化規律進(jìn)行預測,得到線(xiàn)性預測值。4)計算股票價(jià)格原始歷史數據與ARIMA模型預測值之間的殘差,這樣股票價(jià)格的非線(xiàn)性變化規律就隱藏于預測殘差中。5)對股票價(jià)格預測殘差數據進(jìn)行拓階,確定模型最優(yōu)滯后階數,并對股票價(jià)格殘差數據進(jìn)行重構,得到LSSVM的樣本集。6)將重構的股票價(jià)格殘差數據輸入到LSSVM進(jìn)行學(xué)習,并對其進(jìn)行預測,得到股票價(jià)格殘差預測值,即股票價(jià)格非線(xiàn)性部分預測值。7)對線(xiàn)性預測值和非線(xiàn)性預測值進(jìn)行融合,得到股票價(jià)格的最終預測值。其具體工作流程如圖2所示。

  3.5股標價(jià)格預測模型性能評價(jià)指標

  為了評價(jià)股票價(jià)格預測模型性能,采用本研究采用均方根誤差和平均絕對相對誤差作為模型性能評價(jià)指標,它們分別定義如下:(略)。

  4股票價(jià)格組合模型仿真

  4.1數據來(lái)源

  仿真數據來(lái)源于黃山旅游(600054)股票2007年1月到2007年12月的收盤(pán)價(jià),共收集到211個(gè)數據樣本,其中前111個(gè)數據作為訓練集,對股票收盤(pán)價(jià)進(jìn)行建模,最后100個(gè)樣本作為測試集,檢驗股票收盤(pán)價(jià)預測模型的預測性能。600054的收盤(pán)價(jià)格如圖3所示。

  4.2股票價(jià)格的線(xiàn)性部分預測

  對股票價(jià)格的原始數據首先進(jìn)行歸一化處理,然后將211個(gè)數據樣本輸入到DPS6.5軟件中,采用ARIMA模塊得到偏相關(guān)和自相關(guān)圖,如圖4所示。從圖4可知,該股票價(jià)格具有明顯的非平穩性,需要首先對其進(jìn)行差分處理,使其變成平穩時(shí)間序列,ARIMA模型才能進(jìn)行預測。股票價(jià)格的1階偏相關(guān)和自相關(guān)圖如圖5所示,此時(shí),股票價(jià)格基本平穩,因此最佳差分階數d=1。采用從低階到高階逐步試探法來(lái)識別模型的參數,得到600054的收盤(pán)價(jià)格最優(yōu)預測模模型為ARIMA(2,1,1),采用ARIMA(2,1,1)對最后100個(gè)樣本,預測結果如圖6所示。從圖6可知,ARIMA模型對股票價(jià)格的預測精度不高,但是能夠很好的把握股票價(jià)格變化趨勢。

  4.3股票價(jià)格的非線(xiàn)性部分預測

  根據ARIMA(2,1,1)預測結果確定股票價(jià)格的殘差序列,然后采用LSSVM進(jìn)行逐步定階,確定最優(yōu)價(jià)數為3,然后采用最優(yōu)階數重構數據集,然后將訓練本輸入到LSSVM中進(jìn)行學(xué)習建模,并對殘差序列測試集進(jìn)行預測。

  4.4獲得股票價(jià)格的最終預測結果

  將ARIMA(2,1,1)和LSSVM模型預測結果進(jìn)行相加,得到股票價(jià)格的最終預測結果。預測結果如圖7所示。

  4.5與其它預測模型結果對比

  為了驗證基于數據挖掘的股票價(jià)格預測模型的優(yōu)越性,采用單一預測模型ARIMA和LSSVM進(jìn)行對比實(shí)驗,它們對股票價(jià)格測試集的預測結果RMSE和MAPE如表1所示。從表1的對比結果可知,基于數據挖掘的組合預測模型的股票價(jià)格預測精度要遠遠高于單一的ARIMA和SVM模型預測精度,預測誤差大大降低,對比結果表明組合預測模型綜合利用了ARIMA和SVM優(yōu)勢,達到優(yōu)勢互補,克服兩者缺陷,更加全面的刻畫(huà)了股票價(jià)格的變化規律,而單一預測模型只能反映股票價(jià)格部分信息,不能能夠精確描述股票價(jià)格非線(xiàn)性和周期變化規律,因此相對于傳統預測方法,基于數據挖掘的組合預測模型是一種有效股票價(jià)格預測方法。

  5結論

  股票價(jià)格受到多種因素影響,具有復雜非線(xiàn)性變化特點(diǎn),單一預測方法只難反映其片斷信息,預測精度低。為了全面、準確描述股票價(jià)格變化規律,提出一種基于數據挖掘的股票價(jià)格組合預測模型。仿真結果明,組合模型有效提高了股票價(jià)格預測精度,在股票價(jià)格預測中有著(zhù)廣泛的應用前景。

【數據挖掘在股票估價(jià)的運用】相關(guān)文章:

數據挖掘技術(shù)在移動(dòng)通信中的運用02-27

數據挖掘與企業(yè)營(yíng)銷(xiāo)策略探究03-29

數據挖掘論文的參考文獻01-07

淺談反病毒數據庫的數據分類(lèi)挖掘論文02-19

數據挖掘論文的參考文獻范文02-18

數據挖掘與客戶(hù)關(guān)系管理分析02-28

時(shí)間序列數據挖掘研究論文提綱03-27

數據挖掘論文參考文獻范文11-20

數據挖掘技術(shù)的教學(xué)輔助系統應用論文03-16

數據挖掘技術(shù)在就業(yè)指導的應用論文02-27

  • 相關(guān)推薦
激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频