激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频

個(gè)性化電子商務(wù)系統中的自適應過(guò)濾算法探究

時(shí)間:2024-08-02 15:30:22 電子商務(wù)畢業(yè)論文 我要投稿
  • 相關(guān)推薦

個(gè)性化電子商務(wù)系統中的自適應過(guò)濾算法探究

[摘要]電子商務(wù)的飛速發(fā)展在方便顧客的同時(shí)也帶來(lái)了一個(gè)題目:產(chǎn)品過(guò)多致使顧客不能有效選擇其所需產(chǎn)品。為滿(mǎn)足顧客的個(gè)性化電子商務(wù)需求,文章提出一個(gè)新的基于向量空間模型的自適應過(guò)濾算法。該算法首先采用特征向量和偽反饋并借助練習算法來(lái)選取初始過(guò)濾輪廓和閩值,然后運用用戶(hù)反饋通過(guò)過(guò)濾算法對輪廓和值進(jìn)行修正。該算法具備兩個(gè)優(yōu)點(diǎn):一是能夠進(jìn)行自我學(xué)習來(lái)進(jìn)步精確度;二是過(guò)濾過(guò)程無(wú)需大量的初始文本。將其用于電子商務(wù)并進(jìn)行測試,測試結果證實(shí)它是有效的。
  [關(guān)鍵詞]個(gè)性化電子商務(wù);自適應過(guò)濾算法;閩值優(yōu)化算法;精確度;特征選擇
  
  
  電子商務(wù)伴隨著(zhù)互聯(lián)網(wǎng)飛速發(fā)展,同時(shí)也為企業(yè)和顧客帶來(lái)了一個(gè)新局面:企業(yè)發(fā)現競爭日益激烈,生存日益艱難;顧客發(fā)現產(chǎn)品日益增多,但信息處理負擔日益加重,選擇自己所需的產(chǎn)品日益困難。因此,亟需新的市場(chǎng)戰略,如一對一的銷(xiāo)售、客戶(hù)關(guān)系治理等。學(xué)術(shù)界和實(shí)踐者已夸大了這一緊迫性。而個(gè)性化推薦,即為每個(gè)客戶(hù)推薦一個(gè)產(chǎn)品清單供其選擇,就是實(shí)施這些新戰略的方案之一。
  目前已經(jīng)有很多推薦技術(shù),其中協(xié)同過(guò)濾技術(shù)是當前最為成功和廣泛使用的個(gè)性化推薦技術(shù)。它被廣泛應用于網(wǎng)頁(yè)、電影、文章和產(chǎn)品的推薦,作用原理是先識別出具有相似產(chǎn)品需求的顧客群,然后為這一顧客群推薦產(chǎn)品。然而,盡管這些推薦技術(shù)業(yè)已成功,但仍暴露出一些廣為人知的可能導致不良推薦的局限性,如算法的可擴展性、評價(jià)數據的稀疏性和初始資源推薦題目。
  鑒于此,筆者提出一個(gè)新的基于向量空間模型的自適應過(guò)濾算法。該算法改進(jìn)了傳統算法,并將自適應反饋研究機制引進(jìn)智能控制中,因此具備兩個(gè)優(yōu)點(diǎn):一是能夠進(jìn)行自我學(xué)習來(lái)進(jìn)步精確度;二是過(guò)濾過(guò)程無(wú)需大量的初始文本。
  
  一、自適應過(guò)濾算法結構
  
  基于向量空間模型的自適應過(guò)濾算法分為兩步:練習階段和自適應過(guò)濾階段。
  練習階段的任務(wù)是獲取初始過(guò)濾輪廓并設置初始值。
  自適應過(guò)濾階段的主要任務(wù)是對輪廓和值進(jìn)行適應性修改。因主題和文檔均由向量空間模型展示,所以每個(gè)主題和文檔都轉化為特征向量。
  
  (一)練習階段的結構
  
  圖1顯示的是練習階段的結構。首先從正文檔和偽正文檔中提取出特征向量。偽正文檔即練習集里的那些具有與正文檔非常相似的主題卻未能標識成正文檔的文檔。它們可以由多種方式獲得,可以通過(guò)偽反饋獲得,或者通過(guò)種類(lèi)分級結構獲得:一個(gè)主題的偽正文檔之高級種類(lèi)與練習集提供的高級種類(lèi)相同。
  為得到特征向量,首先剔除禁用詞,接著(zhù)對剩余的詞進(jìn)行形態(tài)分析,然后根據公式(1)計算詞語(yǔ)與主題之間的對數交互信息:
  logMI(wi,Tj)=log(p(wi/Tj/p(wi))   (1)
  上述公式中,wi是第i個(gè)詞語(yǔ),Tj是第j個(gè)主題。對數交互信息越高,wi和Tj相關(guān)性越高。p(wi/Tj)和p(wi)由最大可能性方法估計出。
  對于每個(gè)主題,選取那些對數交互信息高于3.0而且在有關(guān)文檔中出現不止一次的詞語(yǔ)。對數交互信息不僅被用作選擇標準,而且被用作特征詞的權重。 得到正文檔和偽正文檔的特征向量之后,將其合并到初始輪廓中。初始輪廓是正文檔和偽正文檔的特征向量之加權和。然后根據練習集里每個(gè)文檔的相似性為每個(gè)主題設置初始值。輪廓與練習文檔之間的相似性由如下余弦公式(2)計算出:
  pj是第j個(gè)主題的輪廓向量,di是第i個(gè)文檔的向量,dik是di中第k個(gè)詞語(yǔ)的權重,由下列公式(3)計算得出:
  
  dik=1 log(tfikavdlIdl)  (3)
  此公式中,如是第i個(gè)文檔中第k個(gè)詞語(yǔ)的條件頻率,dl是形態(tài)處理和禁用詞剔除之后通過(guò)文檔標志計數得到的文檔長(cháng)度,avdl是從練習集得到的均勻文檔長(cháng)度。根據練習文檔的相似性設置每一個(gè)初始值以達到最高過(guò)濾性能。
  
  (二)自適應性算法的結構
  自適應過(guò)濾是自適應過(guò)濾算法的一個(gè)非常重要的階段。我們從練習階段得到了初始輪廓和值。當過(guò)濾輸進(jìn)文檔時(shí),主題輪廓和值則依據各種不同信息,如:用戶(hù)反饋、輸進(jìn)文檔的向量等進(jìn)行自適應更新。
  
  圖2顯示了適應性過(guò)濾的結構。當一個(gè)文檔到達時(shí),其與主題的相似性即被計算出。假如該相似性高于當前值,則這個(gè)文檔被找回,用戶(hù)的相關(guān)性判定也由此得出。假如該文檔真正與主題相關(guān),則其被以為是正實(shí)例,反之則是負實(shí)例。正實(shí)例和負實(shí)例的向量根據公式(4)被用于主題輪廓的修改。
  p'j=pi αpj(pos) βpj(neg)  (4)
  p'j是修改后的主題輪廓,pj修改前的主題輪廓,pj(cos)是更新階段得到的正實(shí)例的向量,pj(neg)是更新階段得到的負實(shí)例的向量;α和β分別是正向量和負向量的權重。
  
  (三)值優(yōu)化算法
  筆者提出一個(gè)新的值優(yōu)化算法。定義該算法使用下列符號:
  t:文檔編號,可以看作是時(shí)問(wèn),由于文檔是按照時(shí)間順序處理的;
  n(f):被處理的文檔的數目;
  nR(f):找回的相關(guān)文檔;
  nN(f):找回的不相關(guān)文檔;
  T(t):在t時(shí)刻的值;
  S(tk,tk 1t):在(tk,tk 1)時(shí)間段中被拒盡的文檔的均勻相似性;
  P(tk tk 1):在(tk,tk 1)時(shí)間段中過(guò)濾的精確度,并且p(tk,tk 1)=nR(tk 1-nR(tk/n(tk ))-n(tk)  (5)
 假如我們憑直覺(jué)處理,精確度太低就應該進(jìn)步值,很少文檔被找回則降低值。我們使用S(tk,tk 1)和P(tk,tk 1)來(lái)決定是進(jìn)步值抑或降低值。
  調整值的算法如下所示:
  IF p(tk,tk 1)≤EP(ttk 1) THEN
  T(tk 1)=T(tk) α(tk 1)(1-T(tk))
  ELSEIF S(ttk,tk 1)<T(tk)r THEN
  T(tk 1)=T(tk)Dt1 S(tk,tk 1)Dt2
  ELSE
  T(tk 1)=T(tk)Dt1 S(tk,tk 1)Dt2
  α(tk 1)是值進(jìn)步系數,β(tk 1)是值降低系數,它們也可以被看作是關(guān)于nR(t)的函數。在試驗中,我們采用nR(t)的線(xiàn)性函數,該函數如公式(6)、公式(7)所示:
  
  αo是初始進(jìn)步系數,β是初始降低系數,參數u代表應該用于調整值、修改輪廓的正文檔的最大數目。我們設置αo=0.02,u=0.1,(應該是βo吧)μ=300。從以上等式可以看出,隨著(zhù)時(shí)間推移,nR(tk)將逐漸增大,α(tk)和β(tk)將逐漸減小。這也反映出過(guò)濾將越來(lái)越好,調整步階將越來(lái)越小這一趨勢。
  參數r表示:假如s(tk 1,tk)低于T(tk 1)r,值應該由系數D1和D2來(lái)降低。在試驗中,我們設置r=0.1,=0.8,=0.2。
  EP(t 1k)表示我們所期看的過(guò)濾應該在tk時(shí)刻達到的精確度。我們首先將其作為常數,嘗試不同的值來(lái)觀(guān)察過(guò)濾性能,但是結果不盡如人意。我們意識到在過(guò)濾初期就?催_到終極期看精確度是不正確的,因而采用了一個(gè)逐漸上升的函數,該函數如公式(8)所示:
  EP(tk 1)=P (Pfinal-P0)nR(tk 1)IU
  (8)
  P0和Ptfinal分別是過(guò)濾初期和過(guò)濾末期我們所?催^(guò)濾達到的精確度。
  nR(tk 1)-nR(tk)的值決定著(zhù)過(guò)濾對值的調整頻率,其越小表明過(guò)濾對值的調整越頻繁。在我們的適應性過(guò)濾中,我們將其設為1,即意味著(zhù)過(guò)濾只在找回一個(gè)正實(shí)例之后才調整值。
  
  二、試驗
  
  根據研究,我們將個(gè)性化服務(wù)系統的合作項目與社區結合起來(lái)。筆者構建了一個(gè)基于為特定社區服務(wù)的電子商務(wù)的個(gè)性化推薦系統網(wǎng)站。為得到對比試驗結果,傳統的過(guò)濾批次算法和自適應過(guò)濾算法被分別應用于個(gè)性化社團過(guò)濾模塊中。試驗數據從上面提及的電子商務(wù)網(wǎng)站得到,并劃分成兩個(gè)集合:練習實(shí)例(5062個(gè)社區)和測試實(shí)例(4028個(gè)社區)。64個(gè)主題也被用于該試驗。試驗結果如圖3所示。x軸是64個(gè)主題按照精確度從高到低排列,Y軸是傳統批次過(guò)濾和自適應過(guò)濾對于每個(gè)種類(lèi)的精確度。傳統批次過(guò)濾為每個(gè)主題提供了12個(gè)相關(guān)社團,適應性過(guò)濾則提供了3個(gè)。此外,每個(gè)種類(lèi)只有3個(gè)相關(guān)社團。
  從圖3可以看出,批次過(guò)濾算法的性能下降不快,兩條曲線(xiàn)非常接近。事實(shí)上,兩個(gè)均勻值分別是30.9%和25.8%,范圍只降低了16.3%。但是,大多數種類(lèi)的精確度在不使用適應性過(guò)濾算法的情況下下降很多,均勻精確度是17.6%,下降45.2%。這就完整揭示了自適應功能。
  
  
  三、結論
  
  綜上所述,筆者提出一個(gè)新的基于向量空間模型的用于電子商務(wù)的自適應過(guò)濾算法。將該算法應用于基于電子商務(wù)的個(gè)性化服務(wù)系統中進(jìn)行測試,測試結果證實(shí)它是有效可行的。?幢疚哪転槠渌芯空咛峁┮欢ǖ膮⒖純r(jià)值。

【個(gè)性化電子商務(wù)系統中的自適應過(guò)濾算法探究】相關(guān)文章:

非理想信道條件下MIMO系統中的自適應調制算法研究03-07

基于3GPP LTE 系統的HARQ 算法探究03-03

OFDMA系統中功率分配算法研究03-07

MCMC算法在MIMO系統檢測中的應用03-07

Tunstall編碼與自適應編碼算法03-07

EPON系統中的FEC譯碼算法實(shí)現比較03-07

網(wǎng)頁(yè)消重中多維布隆過(guò)濾器算法的運用11-18

新型的OFDM自適應調制算法研究03-07

MIMO系統中ZF及MMSE檢測算法的研究03-07

激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频