- 相關(guān)推薦
初探電子商務(wù)在大數據時(shí)代下的數據管理論文
大數據時(shí)代的到來(lái)改變了人們對數據的認識和態(tài)度,電子商務(wù)作為大數據產(chǎn)生的主要來(lái)源之一,其發(fā)展狀態(tài)及趨勢越來(lái)越被人們所關(guān)注。電子商務(wù)數據每年增長(cháng)約60%,但數據利用卻不足5%,人們迫切希望通過(guò)數據的力量來(lái)解決一些發(fā)展道路上遇到的瓶頸問(wèn)題。數據的價(jià)值逐漸被人們所重視,數據的客觀(guān)性、真實(shí)性、可靠性為電子商務(wù)的數據服務(wù)提供了堅實(shí)的“物質(zhì)基礎”,繼而發(fā)展成為一種產(chǎn)業(yè)。那么大數據時(shí)代進(jìn)行數據存儲方式、讀取方式、分析方式的創(chuàng )新以及增加數據服務(wù)模式已經(jīng)成為大勢所趨,本文正是對上述問(wèn)題進(jìn)行初步研究。
一、數據存儲方式
隨著(zhù)Web2.0時(shí)代的到來(lái),傳統的數據存儲模式已經(jīng)不能夠應付規模龐大的數據流。存儲設備的成本增加,數據洪期的不預定型,結構化數據與非結構化數據混雜等因素讓存儲不得不做出徹底的變革。
為了減少存儲成本,提高存儲容量和存儲空間利用率,人們利用虛擬化技術(shù)對存儲設備進(jìn)行改造,將所有存儲空間作為一個(gè)資源池,可以自由的配置存儲設備空間。虛擬化技術(shù)主要利用軟件實(shí)現對存儲資源的控制,根據實(shí)際需要可以將軟件安裝在相應的硬件設備之上。為提高一些性能較為低下的設備利用率,可以通過(guò)網(wǎng)絡(luò )將這些設備連接起來(lái),作為數據存儲的載體。例如San系統,集群系統。San系統與集群系統都可以實(shí)現數據共享和訪(fǎng)問(wèn),并可以對存儲空間進(jìn)行自由的擴展,但是San系統可以支持不同客戶(hù)端的操作系統,擴展范圍更加廣泛,運用更加靈活。
San網(wǎng)絡(luò )存儲由服務(wù)器、存儲、互連組成,利用光纖通道實(shí)現對存儲設備的管理,既可以實(shí)現服務(wù)器到存儲的數據傳輸,也可以實(shí)現服務(wù)器到服務(wù)器的數據通信。San網(wǎng)絡(luò )采用雙環(huán)方式及數據遠程備份,增加了數據安全性。San對于磁盤(pán)進(jìn)行虛擬化,可以讓磁盤(pán)同步存儲數據,加速了磁盤(pán)讀/寫(xiě)操作的效率。
二、數據讀取方式
現階段,電子商務(wù)的數據存儲方式大多依靠廣泛使用的關(guān)系型數據庫。關(guān)系型數據庫采用關(guān)系模型,在結構上更容易理解,而其使用的數據庫操作語(yǔ)言SQL也廣泛被人們所接受。由于其對數據類(lèi)型等多方面的嚴謹性,減少了使得數據庫的維護量,提高了數據管理效率。
然而,隨著(zhù)電子商務(wù)的飛速發(fā)展,數據量的巨增,給關(guān)系數據庫的I/O端口造成了很大的壓力。其次,在對數據的查詢(xún)操作上,尤其是一些大表的嵌套查詢(xún),效率非常低。由于龐大的數據量,對數據庫的維護造成了一定影響,數據庫無(wú)法動(dòng)態(tài)擴展其存儲空間及提高其負載能力。數據庫升級和往往要進(jìn)行停機維護,導致業(yè)務(wù)的中斷。
近年來(lái),非關(guān)系型數據庫及分布式存儲的出現可以解決傳統關(guān)系型數據庫存在的問(wèn)題。NoSQL數據庫是為了解決大規模數據集的管理,包括對數據的存儲及并發(fā)控制。而數據的多樣化,非結構化等難題,給大數據處理及分析帶來(lái)了挑戰,F在NoSQL類(lèi)型有很多,且各自擁有各自的技術(shù)優(yōu)勢,數據管理者要結合自己的需求選擇好合適的NoSQL數據庫,才能體現非關(guān)系型數據庫具備的優(yōu)勢。NoSQL數據庫主要分為:鍵值存儲數據庫,列存儲數據庫,文檔型數據庫,圖形數據庫等。NoSQL數據庫并沒(méi)有一個(gè)統一的架構,兩種NoSQL數據庫之間的不同,甚至遠遠超過(guò)兩種關(guān)系型數據庫的不同。NoSQL沒(méi)有高低之分,只能合理地使用NoSQL到適合的場(chǎng)合,才能充分發(fā)揮NoSQL的優(yōu)勢。
現在比較常用的NoSQL數據庫主要是Redis,Leveldb, Mongodb,HBase。HBase作為Hadoop的子項目,適合于非結構化的數據存儲。HBase的一大特點(diǎn)是基于列的模式,這樣可以增強數據庫的擴展性,提高數據庫的存儲效率。而且,HBase作為分布式數據庫可以在廉價(jià)服務(wù)器上搭建起規模龐大且結構化的存儲集群。
三、數據分析方式
大數據時(shí)代下,人們對數據的態(tài)度有了很大改變,對數據的研究由追尋因果向數據相關(guān)性轉變。然而,對于電子商務(wù)來(lái)說(shuō),需求關(guān)系的分析是電商市場(chǎng)一個(gè)重要因素,仍然不可或缺。電子商務(wù)數據包含了客戶(hù)的基本信息、消費信息、商家的產(chǎn)品信息、金融交易信息等結構化或非結構化數據。對電子商務(wù)數據的分析可分為幾個(gè)方面:
(1)流量數據分析,包含了對電子商務(wù)網(wǎng)站的流量,點(diǎn)擊率等數據的分析。流量的大小可以反映商品的推廣程度,但是,為檢測一些為提高點(diǎn)擊率的惡意、虛假行為,需要對流量來(lái)源等數據進(jìn)行分析,確保點(diǎn)擊率能真實(shí)反映產(chǎn)品推廣程度。網(wǎng)站到達率,二跳率,pv/ip值等數據都可反映商品宣傳的效果。
(2)網(wǎng)站數據分析,網(wǎng)站數據最能直接反映商品推廣效率,商品質(zhì)量及商品銷(xiāo)售情況等重要信息。各式各樣的電商產(chǎn)品琳瑯滿(mǎn)目,客戶(hù)往往會(huì )陷入難以抉擇的尷尬局面,難以達成交易。通過(guò)對網(wǎng)站數據的分析,可以更好的了解客戶(hù)的真實(shí)需求和偏好,并制定相應的營(yíng)銷(xiāo)策略,更好的將商品推銷(xiāo)至客戶(hù)。
(3)信用數據分析,無(wú)論是客戶(hù)還是商家,信用都代表了其交易的真誠度和可靠性。信用主要以交易量及交易評價(jià)作為依據。面對日益競爭激烈的電商市場(chǎng),商家為了提高自身的銷(xiāo)售額,難免采用一些不正當手段,通過(guò)構造虛假評論信息來(lái)提升自己和打擊對手。通過(guò)對評價(jià)數據的分析,可以判斷其評價(jià)的真實(shí)性,避免了一些商家通過(guò)炒作來(lái)提高自身信用和客戶(hù)惡意評價(jià)等行為帶來(lái)的影響。
四、數據服務(wù)模式
大數據時(shí)代下,數據分析所利用的數據不再是通過(guò)簡(jiǎn)單的抽樣得到的樣本,而是要將整體數據作為分析來(lái)源。以大數據的分析手段,得到分析結果。盡管相較于傳統方法,大數據分析需要消耗更多的時(shí)間和資源,然而,往往一些孤僻、異常的數據才是問(wèn)題出現的根本原因,而原有的抽樣方式很有可能將此類(lèi)數據遺漏,影響到最終的分析結果。
通常,數據服務(wù)提供可視化界面,展現數據的統計分析結果。對于大數據的統計分析,需要呈現出更多,更廣的事務(wù)特征。例如,某些電商推出的十年賬單查詢(xún)服務(wù),引起了社會(huì )廣泛的反響。如今,隨著(zhù)大數據分析技術(shù)的革新,數據服務(wù)模式也在不斷增加,大數據輔助決策和預測事物發(fā)展的特點(diǎn)引發(fā)了人們利用數據來(lái)研究事物發(fā)展規律的極大興趣,使得研究結果更具有客觀(guān)性和可靠性。
【初探電子商務(wù)在大數據時(shí)代下的數據管理論文】相關(guān)文章:
情報大數據管理論文08-30
電子商務(wù)下的國際貿易創(chuàng )新初探論文08-29
主數據管理應用與實(shí)踐論文06-24
大數據時(shí)代下的餐飲企業(yè)管理問(wèn)題論文10-25
大數據時(shí)代網(wǎng)絡(luò )教育論文09-12
新媒體時(shí)代下電子商務(wù)教學(xué)論文范文06-18
通信及互聯(lián)網(wǎng)技術(shù)在數據管理的運用論文09-04
電子商務(wù)下的國際貿易創(chuàng )新初探05-12
數據管理演進(jìn)4階段08-08
旅游管理下數據挖掘運用論文09-27