激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频

數據挖掘論文的參考文獻

時(shí)間:2024-05-21 00:19:45 參考文獻 我要投稿

數據挖掘論文的參考文獻

  在日常學(xué)習、工作生活中,大家都有寫(xiě)論文的經(jīng)歷,對論文很是熟悉吧,借助論文可以有效訓練我們運用理論和技能解決實(shí)際問(wèn)題的的能力.相信寫(xiě)論文是一個(gè)讓許多人都頭痛的問(wèn)題,以下是小編收集整理的數據挖掘論文的參考文獻,供大家參考借鑒,希望可以幫助到有需要的朋友.

數據挖掘論文的參考文獻

  數據挖掘論文的參考文獻 篇1

  [1]劉瑩;跀祿诰虻纳唐蜂N(xiāo)售預測分析[J].科技通報.2014(07)

  [2]姜曉娟,郭一娜.基于改進(jìn)聚類(lèi)的電信客戶(hù)流失預測分析[J].太原理工大學(xué)學(xué)報.2014(04)

  [3]李欣海.隨機森林模型在分類(lèi)與回歸分析中的應用[J].應用昆蟲(chóng)學(xué)報.2013(04)

  [4]朱志勇,徐長(cháng)梅,劉志兵,胡晨剛;谪惾~斯網(wǎng)絡(luò )的客戶(hù)流失分析研究[J].計算機工程與科學(xué).2013(03)

  [5]翟健宏,李偉,葛瑞海,楊茹;诰垲(lèi)與貝葉斯分類(lèi)器的網(wǎng)絡(luò )節點(diǎn)分組算法及評價(jià)模型[J].電信科學(xué).2013(02)

  [6]王曼,施念,花琳琳,楊永利。成組刪除法和多重填補法對隨機缺失的二分類(lèi)變量資料處理效果的比較[J].鄭州大學(xué)學(xué)報(醫學(xué)版).2012(05)

  [7]黃杰晟,曹永鋒。挖掘類(lèi)改進(jìn)決策樹(shù)[J].現代計算機(專(zhuān)業(yè)版).2010(01)

  [8]李凈,張范,張智江。數據挖掘技術(shù)與電信客戶(hù)分析[J].信息通信技術(shù).2009(05)

  [9]武曉巖,李康;虮磉_數據判別分析的隨機森林方法[J].中國衛生統計.2006(06)

  [10]張璐。論信息與企業(yè)競爭力[J].現代情報.2003(01)

  [11]楊毅超;赪eb數據挖掘的作物商務(wù)平臺分析與研究[D].湖南農業(yè)大學(xué)2008

  [12]徐進(jìn)華;诨疑到y理論的數據挖掘及其模型研究[D].北京交通大學(xué)2009

  [13]俞馳;诰W(wǎng)絡(luò )數據挖掘的客戶(hù)獲取系統研究[D].西安電子科技大學(xué)2009

  [14]馮軍。數據挖掘在自動(dòng)外呼系統中的應用[D].北京郵電大學(xué)2009

  [15]于寶華;跀祿诰虻母呖紨祿治鯷D].天津大學(xué)2009

  [16]王仁彥。數據挖掘與網(wǎng)站運營(yíng)管理[D].華東師范大學(xué)2010

  [17]彭智軍。數據挖掘的若干新方法及其在我國證券市場(chǎng)中應用[D].重慶大學(xué)2005

  [18]涂繼亮;跀祿诰虻闹悄芸蛻(hù)關(guān)系管理系統研究[D].哈爾濱理工大學(xué)2005

  [19]賈治國。數據挖掘在高考填報志愿上的應用[D].內蒙古大學(xué)2005

  [20]馬飛;跀祿诰虻暮竭\市場(chǎng)預測系統設計及研究[D].大連海事大學(xué)2006

  [21]周霞;谠朴嬎愕奶(yáng)風(fēng)大數據挖掘分類(lèi)算法的研究[D].成都理工大學(xué)2014

  [22]阮偉玲。面向生鮮農產(chǎn)品溯源的基層數據庫建設[D].成都理工大學(xué)2015

  [23]明慧。復合材料加工工藝數據庫構建及數據集成[D].大連理工大學(xué)2014

  [24]陳鵬程。齒輪數控加工工藝數據庫開(kāi)發(fā)與數據挖掘研究[D].合肥工業(yè)大學(xué)2014

  [25]岳雪;诤A繑祿诰蜿P(guān)聯(lián)測度工具的設計[D].西安財經(jīng)學(xué)院2014

  [26]丁翔飛;诮M合變量與重疊區域的SVM—RFE方法研究[D].大連理工大學(xué)2014

  [27]劉士佳;贛apReduce框架的頻繁項集挖掘算法研究[D].哈爾濱理工大學(xué)2015

  [28]張曉東。全序模塊模式下范式分解問(wèn)題研究[D].哈爾濱理工大學(xué)2015

  [29]尚丹丹;谔摂M機的Hadoop分布式聚類(lèi)挖掘方法研究與應用[D].哈爾濱理工大學(xué)2015

  [30]王化楠。一種新的混合遺傳的基因聚類(lèi)方法[D].大連理工大學(xué)2014

  拓展閱讀

  什么是大數據?

  “大數據”到底有多大?根據研究機構統計,僅在2011年,全球數據增量就達到了1.8ZB(即1.8萬(wàn)億GB),相當于全世界每個(gè)人產(chǎn)生200GB以上的數據。這種增長(cháng)趨勢仍在加速,據保守預計,接下來(lái)幾年中,數據將始終保持每年50%的增長(cháng)速度。

  縱觀(guān)人類(lèi)歷史,每一次劃時(shí)代的變革都是以新工具的出現和應用為標志的。蒸汽機把人們從農業(yè)時(shí)代帶入了工業(yè)時(shí)代,計算機和互聯(lián)網(wǎng)把人們從工業(yè)時(shí)代帶入了信息時(shí)代,而如今大數據時(shí)代已經(jīng)到來(lái),它源自信息時(shí)代,又是信息時(shí)代全方位的深化應用與延伸。大數據時(shí)代的生產(chǎn)原材料是數據,生產(chǎn)工具則是大數據技術(shù),是對信息時(shí)代所產(chǎn)生的海量數據的挖掘和分析,從而快速地獲取有價(jià)值信息的技術(shù)和應用。

  概括來(lái)講,大數據有三個(gè)特征,可總結歸納為“3V”,即量(Volume)、類(lèi)(Variety)、時(shí)(Velocity)。量,數據容量大,現在數據單位已經(jīng)躍升至ZB級別。類(lèi),數據種類(lèi)多,主要來(lái)自業(yè)務(wù)系統,例如社交網(wǎng)絡(luò )、電子商務(wù)和物聯(lián)網(wǎng)應用。時(shí),處理速度快,時(shí)效性要求高,從傳統的事務(wù)性數據到實(shí)時(shí)或準實(shí)時(shí)數據。

  什么是數據挖掘?

  數據挖掘,又稱(chēng)為知識發(fā)現(Knowledge Discovery),是通過(guò)分析每個(gè)數據,從大量數據中尋找其規律的技術(shù)。知識發(fā)現過(guò)程通常由數據準備、規律尋找和規律表示3個(gè)階段組成。數據準備是從數據中心存儲的數據中選取所需數據并整合成用于數據挖掘的數據集;規律尋找是用某種方法將數據集所含規律找出來(lái);規律表示則是盡可能以用戶(hù)可理解的方式(如可視化)將找出的規律表示出來(lái)。

  “數據海量、信息缺乏”是相當多企業(yè)在數據大集中之后面臨的尷尬問(wèn)題。目前,大多數事物型數據庫僅實(shí)現了數據錄入、查詢(xún)和統計等較低層次的功能,無(wú)法發(fā)現數據中存在的有用信息,更無(wú)法進(jìn)一步通過(guò)數據分析發(fā)現更高的價(jià)值。如果能夠對這些數據進(jìn)行分析,探尋其數據模式及特征,進(jìn)而發(fā)現某個(gè)客戶(hù)、群體或組織的興趣和行為規律,專(zhuān)業(yè)人員就可以預測到未來(lái)可能發(fā)生的變化趨勢。這樣的數據挖掘過(guò)程,將極大拓展企業(yè)核心競爭力。例如,在網(wǎng)上購物時(shí)遇到的提示“瀏覽了該商品的人還瀏覽了如下商品”,就是在對大量的購買(mǎi)者“行為軌跡”數據進(jìn)行記錄和挖掘分析的基礎上,捕捉總結購買(mǎi)者共性習慣行為,并針對性地利用每一次購買(mǎi)機會(huì )而推出的銷(xiāo)售策略。

  數據挖掘在供電企業(yè)的應用前景

  隨著(zhù)社會(huì )的進(jìn)步和信息通信技術(shù)的發(fā)展,信息系統在各行業(yè)、各領(lǐng)域快速拓展。這些系統采集、處理、積累的數據越來(lái)越多,數據量增速越來(lái)越快,以至用“海量、爆炸性增長(cháng)”等詞匯已無(wú)法形容數據的增長(cháng)速度。

  2011年5月,全球知名咨詢(xún)公司麥肯錫全球研究院發(fā)布了一份題為《大數據:創(chuàng )新、競爭和生產(chǎn)力的下一個(gè)新領(lǐng)域》的報告。報告中指出,數據已經(jīng)滲透到每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對于大數據的運用預示著(zhù)新一波生產(chǎn)率增長(cháng)和消費者盈余浪潮的到來(lái)。2012年3月29日,美國政府在白宮網(wǎng)站上發(fā)布了《大數據研究和發(fā)展倡議》,表示將投資2億美元啟動(dòng)“大數據研究和發(fā)展計劃”,增強從大數據中分析萃取信息的能力。

  在電力行業(yè),堅強智能電網(wǎng)的迅速發(fā)展使信息通信技術(shù)正以前所未有的廣度、深度與電網(wǎng)生產(chǎn)、企業(yè)管理快速融合,信息通信系統已經(jīng)成為智能電網(wǎng)的“中樞神經(jīng)”,支撐新一代電網(wǎng)生產(chǎn)和管理發(fā)展。目前,國家電網(wǎng)公司已初步建成了國內領(lǐng)先、國際一流的信息集成平臺。隨著(zhù)三地集中式數據中心的陸續投運,一級部署業(yè)務(wù)應用范圍的拓展,結構化和非結構化數據中心的上線(xiàn)運行,電網(wǎng)業(yè)務(wù)數據從總量和種類(lèi)上都已初具規模。隨著(zhù)后續智能電表的逐步普及,電網(wǎng)業(yè)務(wù)數據將從時(shí)效性層面進(jìn)一步豐富和拓展。大數據的“量類(lèi)時(shí)”特性,已在海量、實(shí)時(shí)的電網(wǎng)業(yè)務(wù)數據中進(jìn)一步凸顯,電力大數據分析迫在眉睫。

  當前,電網(wǎng)業(yè)務(wù)數據大致分為三類(lèi):一是電力企業(yè)生產(chǎn)數據,如發(fā)電量、電壓穩定性等方面的數據;二是電力企業(yè)運營(yíng)數據,如交易電價(jià)、售電量、用電客戶(hù)等方面的數據;三是電力企業(yè)管理數據,如ERP、一體化平臺、協(xié)同辦公等方面的數據。如能充分利用這些基于電網(wǎng)實(shí)際的數據,對其進(jìn)行深入分析,便可以提供大量的高附加值服務(wù)。這些增值服務(wù)將有利于電網(wǎng)安全檢測與控制(包括大災難預警與處理、供電與電力調度決策支持和更準確的用電量預測),客戶(hù)用電行為分析與客戶(hù)細分,電力企業(yè)精細化運營(yíng)管理等等,實(shí)現更科學(xué)的需求側管理。

  例如,在電力營(yíng)銷(xiāo)環(huán)節,針對“大營(yíng)銷(xiāo)”體系建設,以客戶(hù)和市場(chǎng)為導向,省級集中的95598客戶(hù)服務(wù)、計量檢定配送業(yè)務(wù)屬地化管理的營(yíng)銷(xiāo)管理體系和24小時(shí)面向客戶(hù)的營(yíng)銷(xiāo)服務(wù)系統,可通過(guò)數據分析改善服務(wù)模式,提高營(yíng)銷(xiāo)能力和服務(wù)質(zhì)量;以分析型數據為基礎,優(yōu)化現有營(yíng)銷(xiāo)組織模式,科學(xué)配置計量、收費和服務(wù)資源,構建營(yíng)銷(xiāo)稽查數據監控分析模型;建立各種針對營(yíng)銷(xiāo)的系統性算法模型庫,發(fā)現數據中存在的隱藏關(guān)系, 為各級決策者提供多維的、直觀(guān)的、全面的、深入的分析預測性數據, 進(jìn)而主動(dòng)把握市場(chǎng)動(dòng)態(tài),采取適當的營(yíng)銷(xiāo)策略,獲得更大的企業(yè)效益,更好地服務(wù)于社會(huì )和經(jīng)濟發(fā)展。此外,還可以考慮在電力生產(chǎn)環(huán)節,利用數據挖掘技術(shù),在線(xiàn)計算輸送功率極限,并考慮電壓等因素對功率極限的影響,從而合理設置系統輸出功率,有效平衡系統的安全性和經(jīng)濟性。

  公司具備非常好的從數據運維角度實(shí)現更大程度信息、知識發(fā)現的條件和基礎,完全可以立足數據運維服務(wù),創(chuàng )造數據增值價(jià)值,提供并衍生多種服務(wù)。以數據中心為紐帶,新型數據運維的成果將有可能作為一種新的消費形態(tài)與交付方式,給客戶(hù)帶來(lái)全新的'使用體驗,打破傳統業(yè)務(wù)系統間各自為陣的局面,進(jìn)一步推動(dòng)電網(wǎng)生產(chǎn)和企業(yè)管理,從數據運維角度對企業(yè)生產(chǎn)經(jīng)營(yíng)、管理以及堅強智能電網(wǎng)建設提供更有力、更長(cháng)遠、更深入的支撐。

  數據挖掘專(zhuān)業(yè)就業(yè)方向

  1.數據挖掘主要是做算法還是做應用?分別都要求什么?

  這個(gè)問(wèn)題太籠統,基本上算法和應用是兩個(gè)人來(lái)做的,可能是數據挖掘職位。做算法的比較少,也比較高級。

  其實(shí)所謂做算法大多數時(shí)候都不是設計新的算法(這個(gè)可以寫(xiě)論文了),更多的是技術(shù)選型,特征工程抽取,最多是實(shí)現一些已經(jīng)有論文但是還沒(méi)有開(kāi)源模塊的算法等,還是要求扎實(shí)的算法和數據結構功底,以及豐富的分布式計算的知識的,以及不錯的英文閱讀和寫(xiě)作能力。但即使是這樣也是百里挑一的,很難找到。

  絕大讀書(shū)數據挖掘崗位都是做應用,數據清洗,用現成的庫建模,如果你自己不往算法或者架構方面繼續提升,和其他的開(kāi)發(fā)崗位的性質(zhì)基本沒(méi)什么不同,只要會(huì )編程都是很容易入門(mén)的。

  2.北上廣以外的普通公司用的多嗎?待遇如何?

  實(shí)際情況不太清楚,由于數據挖掘和大數據這個(gè)概念太火了,肯定到處都有人招聘響應的崗位,但是二線(xiàn)城市可能僅僅是停留在概念上,很多實(shí)際的工作并沒(méi)有接觸到足夠大的數據,都是生搬硬套框架(從我面試的人的工作經(jīng)驗上看即使是在北上廣深這種情況也比較多見(jiàn))。

  只是在北上廣深,可能接觸到大數據的機會(huì )多一些。而且做數據挖掘現在熱點(diǎn)的技術(shù)比如Python,Spark,Scala,R這些技術(shù)除了在一線(xiàn)城市之外基本上沒(méi)有足夠的市場(chǎng)(因為會(huì )的人太少了,二線(xiàn)城市的公司找不到掌握這些技術(shù)的人,不招也沒(méi)人學(xué))。

  所以我推測二線(xiàn)城市最多的還是用JAVA+Hadoop,或者用JAVA寫(xiě)一些Spark程序。北上廣深和二線(xiàn)城市程序員比待遇是欺負人,就不討論了。

  3.和前端后端程序員比有什么區別?有什么優(yōu)缺點(diǎn)?

  和傳統的前后端程序員相比,最主要的去別就是對編程水平的要求。從我招聘的情況來(lái)看,做數據挖掘的人編程水平要求可以降低一個(gè)檔次,甚至都不用掌握面向對象。

  但是要求技術(shù)全面,編程、SQL,Linux,正則表達式,Hadoop,Spark,爬蟲(chóng),機器學(xué)習模型等技術(shù)都要掌握一些。前后端可能是要求精深,數據挖掘更強調廣博,有架構能力更好。

  4.目前在學(xué)習機器學(xué)習,如果想找數據挖掘方面的工作應該學(xué)習哪些內容?

  打基礎是最重要的,學(xué)習一門(mén)數據挖掘常用的語(yǔ)言,比如Python,Scala,R;學(xué)習足夠的Linux經(jīng)驗,能夠通過(guò)awk,grep等Linux命令快速的處理文本文件。掌握SQL,MySQL或者PostgreSQL都是比較常用的關(guān)系型數據庫,搞數據的別跟我說(shuō)不會(huì )用數據庫。

  補充的一些技能,比如NoSQL的使用,Elasticsearch的使用,分詞(jieba等模塊的使用),算法的數據結構的知識。

  5.hadoop,hive之類(lèi)的需要學(xué)習嗎?

  我覺(jué)得應當學(xué)習,首先Hadoop和Hive很簡(jiǎn)單(如果你用AWS的話(huà)你可以開(kāi)一臺EMR,上面直接就有Hadoop和Hive,可以直接從使用學(xué)起)。

  我覺(jué)得如果不折騰安裝和部署,還有Linux和MySQL的經(jīng)驗,只要半天到一天就能熟悉Hadoop和Hive的使用(當然你得有Linux和MySQL的基礎,如果沒(méi)有就先老老實(shí)實(shí)的學(xué)Linux和MySQL,這兩個(gè)都可以在自己的PC上安裝,自己折騰)。

  Spark對很多人來(lái)說(shuō)才是需要學(xué)習的,如果你有JAVA經(jīng)驗大可以從JAVA入門(mén)。如果沒(méi)有那么還是建議從Scala入門(mén),但是實(shí)際上如果沒(méi)有JAVA經(jīng)驗,Scala入門(mén)也會(huì )有一定難度,但是可以慢慢補。

  所以總的來(lái)說(shuō)Spark才足夠難,以至于需要學(xué)習。

  最后的最后我有一些建議。第一要對自己有一個(gè)系統的認知,自己的編程水平夠么,SQL會(huì )用么,Linux會(huì )用么,能流暢的看英文文檔么?

  如果上面任何一個(gè)問(wèn)題的答案是No,我都不建議直接轉行或者申請高級的數據挖掘職位(因為你很難找到一個(gè)正經(jīng)的數據挖掘崗位,頂多是一些打擦邊球的崗位,無(wú)論是實(shí)際干的工作還是未來(lái)的成長(cháng)可能對你的幫助都不大)。

  無(wú)論你現在是學(xué)生還是已經(jīng)再做一些前段后端、運維之類(lèi)的工作你都有足夠的時(shí)間補齊這些基礎知識。

  補齊了這些知識之后,第一件事就是了解大數據生態(tài),Hadoop生態(tài)圈,Spark生態(tài)圈,機器學(xué)習,深度學(xué)習(后兩者需要高等數學(xué)和線(xiàn)性代數基礎,如果你的大學(xué)專(zhuān)業(yè)學(xué)這些不要混)。

【數據挖掘論文的參考文獻】相關(guān)文章:

數據挖掘論文的參考文獻范文02-18

數據挖掘論文參考文獻范文11-20

數據結構論文參考文獻02-26

時(shí)間序列數據挖掘研究論文提綱03-27

淺談反病毒數據庫的數據分類(lèi)挖掘論文02-19

數據挖掘技術(shù)的教學(xué)輔助系統應用論文03-16

數據挖掘技術(shù)在就業(yè)指導的應用論文02-27

數據挖掘在電力企業(yè)中的應用論文12-13

數據挖掘在現代遠程教育中的應用論文11-22

激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频