- 相關(guān)推薦
大數據心得體會(huì )范文(通用15篇)
我們從一些事情上得到感悟后,寫(xiě)心得體會(huì )是一個(gè)不錯的選擇,這樣就可以通過(guò)不斷總結,豐富我們的思想。那么要如何寫(xiě)呢?下面是小編精心整理的大數據心得體會(huì )范文,僅供參考,希望能夠幫助到大家。
大數據心得體會(huì ) 1
對于暢銷(xiāo)書(shū)刊、熱點(diǎn)話(huà)題、時(shí)尚科技,始終不太感興趣。書(shū)刊,喜歡有一定年份的。話(huà)題,鐘情于務(wù)虛的觀(guān)點(diǎn)。新奇的產(chǎn)品于我無(wú)緣,習慣使用成熟的科技產(chǎn)品。既不清高,也非冷漠,就是要與現實(shí)保持一定的距離,給自己留一點(diǎn)思考的空間。這一習慣最近破了例。由于工作的原因,耳濡目染,“大數據”這個(gè)新興概念開(kāi)始頻繁步入我的視野。按捺不住內心的好奇,網(wǎng)購《大數據時(shí)代》,手不釋卷,三天讀完,頗有收獲。此書(shū)有如下特點(diǎn)。
首先,作者站在理論的制高點(diǎn)上,條理清楚地闡述了大數據對人類(lèi)的工作、生活、思維帶來(lái)的革新,大數據時(shí)代的三種典型的商業(yè)模式,以及大數據時(shí)代對于個(gè)人隱私保護、公共安全提出的挑戰。其次,文中的'事例貼近現實(shí)生活,貼近時(shí)代,令讀者既印象深刻,又感同身受。此外,作者沒(méi)有使用大量的專(zhuān)業(yè)術(shù)語(yǔ),沒(méi)有假裝一副專(zhuān)業(yè)的面孔?v觀(guān)全書(shū),遣詞造句,均通俗易懂。
作者認為大數據時(shí)代具有三個(gè)顯著(zhù)特點(diǎn)。
一、人們研究與分析某個(gè)現象時(shí),將使用全部數據而非抽樣數據。
二、在大數據時(shí)代,不能一味地追求數據的精確性,而要適應數據的多樣性、豐富性、甚至要接受錯誤的數據。
三、了解數據之間的相關(guān)性,勝于對因果關(guān)系的探索!笆鞘裁础北取盀槭裁础敝匾。
作者指出,隨著(zhù)技術(shù)的發(fā)展,數據的存儲與處理成本顯著(zhù)降低,人們現在有能力從支離破碎的、看似毫不相干的數據礦渣中抽煉出真知爍見(jiàn)。在大數據時(shí)代,三類(lèi)公司將成為時(shí)代的寵兒。一是擁有大數據的公司與組織。如政府、銀行、電信公司、全球性互聯(lián)網(wǎng)公司(阿里巴巴、淘寶網(wǎng))。
二是擁有數據分析與處理技術(shù)的專(zhuān)業(yè)公司,如亞馬遜、谷歌。三是擁有創(chuàng )新思維的公司,他們可能既不掌握大數據,也沒(méi)有專(zhuān)業(yè)技術(shù),但卻擅長(cháng)使用大數據,從大數據中找到自己的理想天地。
面對即將來(lái)臨的大數據時(shí)代,個(gè)人將如何應對自如?這是個(gè)嚴肅的問(wèn)題。
大數據心得體會(huì ) 2
首先,想談一談何為大數據,何為大數據時(shí)代。大數據是一種資源,也是一種工具。它提供一種新的思維方式去理解當今這個(gè)信息化世界。為何說(shuō)是一種新的思維方式:在信息缺乏的時(shí)代或模擬時(shí)代,我們更傾向于精確性的思維方式,就像是”釘是釘,鉚是鉚”,而在這種傳統的思維方式下,我們得到問(wèn)題的答案只有一個(gè)。
而在大數據時(shí)代下,我們打破了這種思維方式,換句話(huà)說(shuō),我們接受結果的不確定性。簡(jiǎn)言概括之,我認為大數據是一種預測模型。在大數據時(shí)代下,我們關(guān)注的不是因果,即為什么是這樣,而更關(guān)心”是什么”這種相關(guān)關(guān)系。換句話(huà)說(shuō),在這種新思維的思考方式下,我們探究問(wèn)題背后的原因也是不可行的。我們所做的是利用大數據這種工具,讓數據自己說(shuō)話(huà)!
其次,我想談下如何利用大數據提升我軍戰斗力。當然,大數據分析并不是精準的預測,精準的預測也是不存在的。大數據只能有利于我們理解現在和預測未來(lái)的可能性。
作為軍人,我所關(guān)注的是如何利用好大數據的'工具提升我軍戰斗力,打贏(yíng)這場(chǎng)信息化戰爭。毫無(wú)疑問(wèn),現在我們打的不是刀對刀,槍對槍的戰爭,更不是模擬時(shí)代,當代乃是數字時(shí)代,打的是信息化戰爭!
四次戰爭的大勝,美軍的戰爭形態(tài)從機械化轉向信息化,而且相應的在戰場(chǎng)取勝的時(shí)間也越來(lái)越短,這正是大數據時(shí)代下的必然結果。而我軍正在轉向信息化的過(guò)程中。
在此戰爭形態(tài)的過(guò)程中,我們需要更多的計算分析師,大數據分析師,數學(xué)家等高等技術(shù)性人才來(lái)打贏(yíng)這場(chǎng)信息化戰爭。這正是大數據時(shí)代下我們不得不有的基礎。我軍戰斗力的提升迫在眉睫!
當然大數據是一把雙刃劍,利用好了取勝也是得心應手,相反,利用不好會(huì )導致不可估量的損失。
畢竟,這只是一種預測模型,得不到精準的預測結果。我們更要讓數據為我們所用,不要被龐大的數據庫框住我們的思維。為適應時(shí)代的發(fā)展,在這個(gè)適者生存,弱肉強食的世界,大數據時(shí)代下的殘酷競爭已經(jīng)給我們敲響警鐘,一場(chǎng)悄無(wú)聲息的信息化戰爭已經(jīng)打響!
大數據心得體會(huì ) 3
讀完《大數據》,我才意識到這并不是一本枯燥無(wú)味的書(shū)籍。作者運用案例和講故事的方式,把美國數據開(kāi)放、收集、使用背后的立法故事、公民故事、技術(shù)故事、商業(yè)故事娓娓道來(lái),引人入勝,令我大開(kāi)眼界。
我在想,大數據概念對于教育來(lái)說(shuō)會(huì )產(chǎn)生什么樣的實(shí)用價(jià)值呢?一直以來(lái),中國教育在研究教育的數字化,比如數字化校園,這個(gè)思路就是把我們教育的內容進(jìn)行數字化,其結果指向的就是電子教材的研發(fā)或者是教學(xué)過(guò)程的數字化。美其名曰,這是教育技術(shù)的重要內涵。
在教學(xué)過(guò)程中,學(xué)生的行為表現都可以被數據化,而這項研究不是任何一個(gè)專(zhuān)業(yè)可以深入下去的,它的專(zhuān)業(yè)性太強,所以我才會(huì )想到,所謂教育技術(shù)與其研究教育的數字化,不如研究教育的數據化來(lái)得實(shí)在,來(lái)的有意義。長(cháng)期以來(lái),我們并不了解教育對一個(gè)人的影響具體會(huì )如何表現,我們有的只是一個(gè)輪廓,我們也并不確定一個(gè)教師的行為對學(xué)生具體產(chǎn)生了哪些影響。
所以,人們對教育一直有一個(gè)深深的質(zhì)疑,它是不是科學(xué)的?大數據概念至少提出了關(guān)注“是什么”比“為什么”要有實(shí)際意義得多。
而我們的.教育恰好需要把注意力從“為什么”轉移到“是什么”上面來(lái),只有如此,才能把教育從為什么發(fā)展成“可能成為什么”上來(lái),這會(huì )是一次思想上的革命。而對于現在地位岌岌可危的教育技術(shù)來(lái)說(shuō),把研究的重點(diǎn)從數字化轉移到數據化上面,這才是它的出路。
如何將數據融入教學(xué),教育者首先通過(guò)標準化全科教學(xué)處方,實(shí)現了教師授課模板和教學(xué)內容的標準化,保證每個(gè)教學(xué)過(guò)程和內容是可控的,然后結合每天的教學(xué)內容,處理好面對的數據,處理好數據,自然也就處理好了課堂的反饋,最終形成了既注重教學(xué)體驗又以教學(xué)結果為導向的教學(xué)體系。
與此同時(shí),不僅要注重課上的學(xué)生資源,在課后還要對這些資源進(jìn)行跟蹤處理。這與過(guò)去的教育教學(xué)顯然是不同的,面對大數據時(shí)代的到來(lái),教學(xué)有所改變是必然的。所以,無(wú)論環(huán)境怎么變換,數據如何復雜,我們都不能不去改變自己的`教學(xué)去迎合將來(lái)的這個(gè)大數據時(shí)代。
大數據心得體會(huì ) 4
去年的“云計算”炒得熱火朝天的,今年的“大數據”又突襲而來(lái)。仿佛一夜間,各廠(chǎng)商都紛紛改旗換幟,推起“大數據”來(lái)了。于是乎,各企業(yè)的CIO也將熱度紛紛轉向關(guān)注“大數據”來(lái)了。有一張來(lái)自《程序員》微博的漫畫(huà)很形象。我覺(jué)得這張圖,很真實(shí)地反映了現實(shí)中小企業(yè)云計算,大數據的現狀。
不過(guò)話(huà)又還得說(shuō)回來(lái),《大數據時(shí)代》是本好書(shū)。
當然,很多IT知名人士也大力推薦,寫(xiě)了好多讀后感來(lái)表述對這本書(shū)的喜歡沒(méi)看此書(shū)之前,對所謂大數據的概念基本上是一頭霧水,雖則有了解關(guān)注過(guò)現在也比較火熱的BI,覺(jué)得也差不多,可能就是更多的數據,更細致的數據分析與數據挖掘?催^(guò)此書(shū)后,感覺(jué)到之前的想法,只能算是中了一小半吧—。
巨量的數據,而另一前:著(zhù)眼于數據關(guān)聯(lián)性,而非數據精確性,或許才是大數據與現時(shí)BI的不同,不僅僅是方法,更多的時(shí)思想方法。不過(guò)坦白講,到底是數據的關(guān)聯(lián)性重佳,還是數據的精確性更好,還真的需要時(shí)間來(lái)檢驗一下,至少從現在的數據分析方法來(lái)論,更多的傾向于數據的精確性。
看完此書(shū),我心中的一些問(wèn)題:
1、什么是大數據?
查了查百度百科,是這樣定義的:大數據(bigdata),或稱(chēng)巨量資料,指的是所涉及的資料量規模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。大數據的4V特點(diǎn):Volume、Velocity、Variety、Veracity這個(gè)好像是IBM的定義吧。
以個(gè)人的觀(guān)點(diǎn)來(lái)看:數據海量,存儲海量都是大數據的基本原型吧。
2、大數據適合什么樣的企業(yè)?
誠然,大數據的前提是海量的數據,只有擁有巨量的數據資源,方能從中查找出數據的關(guān)聯(lián)性,才可以讓通過(guò)專(zhuān)業(yè)化的`處理,讓其為企業(yè)產(chǎn)生價(jià)值。針對電信運營(yíng),互聯(lián)網(wǎng)應用這樣海量用戶(hù)的數據的大企業(yè),也是在應用大數據的道路上擁有得天獨厚的條件,但是針對中小企業(yè)呢?銷(xiāo)售訂單數據?若非百年老店,估計數據也是少得可憐,能用的可能只有消費者數據了吧。貌似大多數廠(chǎng)商,用來(lái)舉例的也就是消費都購買(mǎi)行為分析為最多。
同樣,在公共事業(yè)類(lèi)的政府機構,大數據的作用也許也能很好的發(fā)揮。反而感覺(jué)在大多數中小型企業(yè)應用大數據,似乎有點(diǎn)大題小作。書(shū)中說(shuō):大數據是企業(yè)競爭力。誠然,數據是一個(gè)企業(yè)的核心無(wú)形資源(利用得好的話(huà)),但是否所有的數據,或都換則方式說(shuō):所有的企業(yè)都以大數據為競爭力,是否真的合適么?是否在中小企業(yè)中,會(huì )顯示得小題大做呢?
3、大數據帶來(lái)的影響
當一波又一波的IT技術(shù)熱潮源源不斷地向我們鋪面而來(lái)的時(shí)候,你甚至都沒(méi)有做好準備,你都要開(kāi)始迎接它所給你帶來(lái)的影響了。經(jīng)過(guò)物聯(lián)網(wǎng),云計算的推波助瀾下,大數據開(kāi)始登場(chǎng)了。但它到底給我們帶來(lái)了什么呢?
1)預測未來(lái)書(shū)中以Google成功預測了未來(lái)可能發(fā)生流感的案例來(lái)開(kāi)篇,表明通過(guò)大數據的應用,可以為我們的生活起一個(gè)保駕護航的指向標。實(shí)質(zhì)很簡(jiǎn)單,技術(shù)改變世界。
2)變革商業(yè)大數據所帶來(lái)的商機,同時(shí)會(huì )衍生出一系列與大數據相關(guān)的商業(yè)機遇與商業(yè)模式,數據的潛在價(jià)值會(huì )源源不斷地發(fā)揮作用可以容易想到的是未來(lái)有專(zhuān)門(mén)的數據收集,數據分析,數據生成的一條數據產(chǎn)業(yè)鏈產(chǎn)生。影響的,當然是IT公司。
3)變革思維書(shū)中所說(shuō):因為有海量的數據作基礎,未來(lái),我們可能更關(guān)注數據的相關(guān),而非精細度。對這條,本人還是持保留意見(jiàn)的。
大數據心得體會(huì ) 5
如今說(shuō)起新媒體和互聯(lián)網(wǎng),必提大數據,似乎不這樣說(shuō)就OUT了。而且人云亦云的居多,不少談?wù)撜呱踔吝沒(méi)有認真讀過(guò)這方面的經(jīng)典著(zhù)作——舍恩佰格的《大數據時(shí)代》。
維克托·邁爾舍恩伯格何許人也?他現任牛津大學(xué)網(wǎng)絡(luò )學(xué)院互聯(lián)網(wǎng)研究所治理與監管專(zhuān)業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監管科研項目負責人。他的咨詢(xún)客戶(hù)包括微軟、惠普和IBM等全球企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔任多國政府高層的智囊。
這位被譽(yù)為:大數據時(shí)代的。預言家“的牛津教授真牛!那么,這位大師說(shuō)的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進(jìn)行一場(chǎng)思想上的對話(huà)。
舍恩伯格分三部分來(lái)討論大數據,即思維變革、商業(yè)變革和管理變革。
在第一部分”大數據時(shí)代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個(gè)觀(guān)點(diǎn):
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系。對于第一個(gè)觀(guān)點(diǎn),我不敢茍同。
一方面是對全體數據進(jìn)行處理,在技術(shù)和設備上有相當高的難度。另一方面是不是都有此必要,對于簡(jiǎn)單事實(shí)進(jìn)行判斷的數據分析難道也要采集全體數據嗎?
我曾與香港城市大學(xué)的祝建華教授討論過(guò)。祝教授是傳播學(xué)研究方法和數據分析的專(zhuān)家,他認為一定可以找到一種數理統計方法來(lái)進(jìn)行分析,并不一定需要全部數據。聯(lián)系到舍恩伯格第二個(gè)觀(guān)點(diǎn)中所說(shuō)的相關(guān)關(guān)系,我理解他說(shuō)的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限于目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀(guān)點(diǎn),我認為這是對他第一個(gè)觀(guān)點(diǎn)很好的補充,這也是對精準傳播和精準營(yíng)銷(xiāo)的一種反思!贝髷祿暮(jiǎn)單算法比小數據的復雜算法更有效!案哂泻暧^(guān)視野和東方哲學(xué)思維。對于舍恩伯格的第三個(gè)觀(guān)點(diǎn),我也不能完全贊同!辈皇且蚬P(guān)系,而是相關(guān)關(guān)系!安恍枰馈睘槭裁础,只需要知道”是什么“。傳播即數據,數據即關(guān)系。在小數據時(shí)代人們只關(guān)心因果關(guān)系,對相關(guān)關(guān)系認識不足,大數據時(shí)代相關(guān)關(guān)系舉足輕重,如何強調都不為過(guò),但不應該完全排斥它。大數據從何而來(lái)?為何而用?如果我們完全忽略因果關(guān)系,不知道大數據產(chǎn)生的前因后果,也就消解了大數據的人文價(jià)值。如今不少學(xué)者為了闡述和傳播其觀(guān)點(diǎn)往往語(yǔ)出驚人,對舊有觀(guān)念進(jìn)行徹底的否定。
世間萬(wàn)物的復雜性多樣化并非非此即彼那么簡(jiǎn)單,舍恩伯格也是這種二元對立的.幼稚思維嗎?其實(shí)不然,讀者在閱讀時(shí)一定要看清楚他是在什么語(yǔ)境下說(shuō)的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說(shuō)舍恩伯格在提出”不是因果關(guān)系,而是相關(guān)關(guān)系!斑@一論斷時(shí),他在書(shū)中還說(shuō)道:”在大多數情況下,一旦我們完成了對大數據的相關(guān)關(guān)系分析,而又不再滿(mǎn)足于僅僅知道‘是什么’時(shí),我們就會(huì )繼續向更深層次研究的因果關(guān)系,找出背后的“為什么”!坝纱丝梢(jiàn),他說(shuō)的全體數據和相關(guān)關(guān)系都在特定語(yǔ)境下的,是在數據挖掘中的選項。
大數據研究的一大驅動(dòng)力就是商用,舍恩伯格在第二部分里討論了大數據時(shí)代的商業(yè)變革。舍恩伯格認為數據化就是一切皆可”量化“,大數據的定量分析有力地回答”是什么“這一問(wèn)題,但仍然無(wú)法完全回答”為什么“。因此,我認為并不能排除定性分析和質(zhì)化研究。數據創(chuàng )新可以創(chuàng )造價(jià)值,這是毫無(wú)疑問(wèn)的。舍恩伯格在討論大數據的角色定位時(shí)仍把它置于數據應用的商業(yè)系統中,而沒(méi)有把它置于整個(gè)社會(huì )系統里,但他在第二部分大數據時(shí)代的管理變革中討論了這個(gè)問(wèn)題。
在風(fēng)險社會(huì )中信息安全問(wèn)題日趨凸顯。如何擺脫大數據的困境?舍恩伯格在最后一節”掌控“中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個(gè)問(wèn)題?至少可以提供更多的思考維度。正如舍恩伯格在結語(yǔ)中所道:”大數據并不是一個(gè)充斥著(zhù)算法和機器的冰冷世界,人類(lèi)的作用依然無(wú)法被完全替代。
大數據為我們提供的不是最終答案,只是參考的答案,幫助是暫時(shí)的,而更好的方法和答案還在不久的未來(lái)!爸x謝舍恩伯格!讓大數據討論從自然科學(xué)回到人文社科。由此推斷,《大數據時(shí)代》不是最終答案,也不是標準答案,只是參考的答案。
此外,在閱讀此書(shū)之前還必須具備一些數據科學(xué)的基本知識和基本概念,比如說(shuō)什么叫數據?什么叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什么不同?讀前做些功課讀起來(lái)就比較好懂了。
大數據心得體會(huì ) 6
信息時(shí)代的到來(lái),我們感受到的是技術(shù)變化日新月異,隨之而來(lái)的是生活方式的轉變我們這樣評論著(zhù)的信息時(shí)代已經(jīng)變?yōu)樵?jīng)。如今,大數據時(shí)代成為炙手可熱的話(huà)題。筆者在這說(shuō)明信息和數據,只是試圖首先說(shuō)明信息、數據的關(guān)系和不同,也試圖說(shuō)明,為什么信息時(shí)代轉變?yōu)榱舜髷祿䲡r(shí)代?大數據時(shí)代帶給了我們什么?
信息和數據的定義。維基百科解釋?zhuān)盒畔,又稱(chēng)資訊,是一個(gè)高度概括抽象概念,是一個(gè)發(fā)展中的動(dòng)態(tài)范疇,是進(jìn)行互相交換的內容和名稱(chēng),信息的界定沒(méi)有統一的.定義,但是信息具備客觀(guān)、動(dòng)態(tài)、傳遞、共享、經(jīng)濟等特性卻是大家的共識。數據:或稱(chēng)資料,指描述事物的符號記錄,是可定義為意義的實(shí)體,它涉及到事物的存在形式。它是關(guān)于事件之一組離散且客觀(guān)的事實(shí)描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類(lèi)。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來(lái),數據是原始的處女地,需要耕耘。信息則是已經(jīng)處理過(guò)的可以傳播的資訊。信息時(shí)代依賴(lài)于數據的爆發(fā),只是當數據爆發(fā)到無(wú)法駕馭的狀態(tài),大數據時(shí)代應運而生。這是否是《大數據時(shí)代》一書(shū)所未曾闡述的背景材料?
在《大數據時(shí)代》一書(shū)中,大數據時(shí)代與小數據時(shí)代的區別:1、思維慣例。大數據時(shí)代區別與轉變就是,放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說(shuō)只要知道“是什么”,而不需要知道“為什么”。作者語(yǔ)言絕對,卻反思其本質(zhì)區別。數據的更多、更雜,導致應用主意只能盡量觀(guān)察,而不是傾其所有進(jìn)行推理?這也是明智之舉2、使用用途。小數據停留在說(shuō)明過(guò)去,大數據用驅動(dòng)過(guò)去來(lái)預測未來(lái)。筆者認為數據的用途意在何為,與數據本身無(wú)關(guān),而與數據的解讀者有關(guān),而相關(guān)關(guān)系更有利于預測未來(lái)。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實(shí)齊頭并進(jìn),理論來(lái)創(chuàng )立處理非結構化數據的方法,處理結果與未來(lái)進(jìn)行驗證。4、分析基礎。大數據是在互聯(lián)網(wǎng)背景下數據從量變到質(zhì)變的過(guò)程。筆者認為,小數據時(shí)代也即是信息時(shí)代,是大數據時(shí)代的前提,大數據時(shí)代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
數據未來(lái)的故事。數據的發(fā)展,給我們帶來(lái)什么預期和啟示?銀行業(yè)天然有大數據的潛質(zhì)?蛻(hù)數據、交易數據、管理數據等海量數據不斷增長(cháng),海量機遇和挑戰也隨之而來(lái),適應變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準的決策判斷能力、可以有更優(yōu)秀的經(jīng)營(yíng)管理能力可以這些都基于數據的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng )新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創(chuàng )造“數據融合”,實(shí)現“數據應用”才能擁抱“大數據”時(shí)代,從數據中攫取價(jià)值,笑看風(fēng)云變換,穩健贏(yíng)取未來(lái)。
大數據心得體會(huì ) 7
讀了《大數據時(shí)代》后,感覺(jué)到一個(gè)大變革的時(shí)代將要來(lái)臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰栗起來(lái)。
“在小數據時(shí)代,我們會(huì )假象世界是怎樣運作的,然后通過(guò)收集和分析數據來(lái)驗證這種假想!薄半S著(zhù)由假想時(shí)代到數據時(shí)代的過(guò)渡,我們也很可能認為我們不在需要理論了!睍(shū)中幾乎肯定要顛覆統計學(xué)的理論和方法,也試圖通過(guò)引用《連線(xiàn)》雜志主編安德森的話(huà)“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來(lái)“終結”量子力學(xué)。對此我很高興,因為統計學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權威,太基本了,我想我不可能靠一本書(shū)就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認為”這樣的保護傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會(huì )被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數據是“通往未來(lái)的必然改變”,那我就必須“不受限于傳統的.思維模式和特定領(lǐng)域里隱含的固有偏見(jiàn)”,跟作者一起先把統計學(xué)和量子力學(xué)否定掉再說(shuō)。反正我也不喜歡、也學(xué)不會(huì )它們。
當我們人類(lèi)的數據收集和處理能力達到拍字節甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以?huà)仐壱猿闃诱{查為基礎的統計學(xué)了。但是由統計學(xué)和量子力學(xué)以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話(huà),就讓我很擔心了!
《大數據時(shí)代》第16頁(yè)“大數據的核心就是預測”。邏輯是——描述時(shí)空信息“類(lèi)”與“類(lèi)”之間長(cháng)時(shí)間有效不變的先后變化關(guān)系規則。兩者似乎是做同一件事?纱髷祿摹安皇且蚬P(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒(méi)必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個(gè)結果,就是要否定掉其中之一。這就是讓我很擔心的原因。
可我卻不能拭目以待,像旁觀(guān)者一樣等著(zhù)哪一個(gè)“脫穎而出”,因為我身處其中。問(wèn)題不解決,我就沒(méi)法思考和工作,自然就沒(méi)法活了!更何況還有兩個(gè)更可怕的事情。
其一:量子力學(xué)搞了一百多年,為了處理好混雜性問(wèn)題,把質(zhì)量和速度結合到能量上去了,為了調和量子力學(xué)與相對論的矛盾,又搞出一個(gè)量子場(chǎng)論,再七搞八搞又有了蟲(chóng)洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機器。唯一阻止那些“愛(ài)因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因為爸爸就是爸爸,兒子就是兒子。那么大數據會(huì )不會(huì )通過(guò)正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區別在于人有邏輯思維而機器沒(méi)有!洞髷祿䲡r(shí)代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類(lèi)的結果,那我還不如現在就趁早跳樓。
還好我知道自己對什么統計學(xué)、量子力學(xué)、邏輯學(xué)和大數據來(lái)說(shuō)都是門(mén)外漢,也許上面一大篇都是在胡說(shuō)八道,所謂的擔心根本不存在。但問(wèn)題出現了,還是解決的好,不然沒(méi)法睡著(zhù)覺(jué)。自己解決不了就只能依靠專(zhuān)家來(lái)指點(diǎn)迷津。
所以想向《大數據時(shí)代》的作者提一個(gè)合理化建議:把這本書(shū)繼續寫(xiě)下去,至少加一個(gè)第四部分——大數據時(shí)代的邏輯思維。
大數據心得體會(huì ) 8
《大數據時(shí)代》,作者大數據時(shí)代的讀書(shū)筆記【英】維克托及肯尼思合著(zhù),大數據是當今世界最熱門(mén)的詞匯,很多媒體、創(chuàng )業(yè)者、領(lǐng)導都言必稱(chēng)大數據,然而,到底何為大數據,大數據對我們方方面面的影響是怎樣的?閑來(lái)重讀,仍有啟發(fā)。
在作者看來(lái),大數據時(shí)代,要從三個(gè)方面改變我們的思維方式和操作方式,一是要分析所有數據而不僅僅依靠少量的樣本數據;二是不必追求精確性而要依賴(lài)于數據的豐富性,大數據的簡(jiǎn)單算法比小數據的復雜算法更有效。三是,不再探求難以捉摸的因果關(guān)系,轉而關(guān)注事物的相關(guān)關(guān)系,知道“是什么”就夠了,沒(méi)有必要知道“為什么”。在越來(lái)越多的情況下,快速清晰的相關(guān)關(guān)系分析比慢速的因果分析更有用和更有效。
作者認為,在小數據世界中,相關(guān)關(guān)系就有價(jià)值,在大數據世界中,相關(guān)關(guān)系大放異彩,直接可以解決問(wèn)題,例如購物網(wǎng)站中的個(gè)性化相關(guān)推薦,如果A和B經(jīng)常一起發(fā)生,我們只需要注意到B發(fā)生了,就可以預測A也發(fā)生了。大數據的相關(guān)關(guān)系分析更準確、更快,而且不易受偏見(jiàn)影響。
書(shū)中另外有價(jià)值的點(diǎn):
大數據的真正含義不是數據海量,而是“全數據”和“個(gè)體數據”,即數據是全部的數據而非隨機抽樣的,以及技術(shù)的發(fā)展已經(jīng)可以幫助我們針對每一個(gè)個(gè)體進(jìn)行數據分析。
大數據對我們的核心價(jià)值是預測。
找到一個(gè)關(guān)聯(lián)物并監控它,我們就能預測未來(lái)。因為任何事物的發(fā)生都不會(huì )是瞬間的,而是慢慢出問(wèn)題的,通過(guò)搜集所有的數據,我們可以預先捕捉到事物要變化的信號。
數據的`價(jià)值并不僅局限于特定用戶(hù),它可以為了同一目的多次使用,也可以用于其他目的,數據的價(jià)值是其所有可能用途的總和。每個(gè)組織都應該收集盡可能多的使用數據并保存盡可能長(cháng)的時(shí)間。
大數據并不是一個(gè)充斥著(zhù)運算法則和機器的冰冷世界,其中仍需要人類(lèi)扮演重要角色。大數據是一種資源,也是一種工具,一旦得以有效利用,大數據就可以變革公司的盈利模式。
總之,世界上也許沒(méi)有互聯(lián)網(wǎng)思維,但是一定有大數據思維,即使用全體數據而不是隨機抽樣,降低對精確性的要求而使用海量數據,以及,用相關(guān)關(guān)系解決問(wèn)題而非鉆到因果關(guān)系的牛角尖之中。
大數據心得體會(huì ) 9
世界正邁入大數據、云計算的時(shí)代,人類(lèi)朝著(zhù)數據化、數字化的方向發(fā)足狂奔,我們原有的科學(xué)、技術(shù)、工作和生活方式正在被信息技術(shù)所改寫(xiě),很多科學(xué)領(lǐng)域會(huì )被大數據技術(shù)所替代,也會(huì )崛起很多新興科學(xué)家和職業(yè),譬如數據科學(xué)家、數據中間商等。大數據會(huì )顛覆很多的產(chǎn)業(yè)和行業(yè),甚至一夜之間就能變換運營(yíng)模式,因為在大數據面前,人類(lèi)不會(huì )再向以前那樣追尋著(zhù)“為什么”,更多的是在樣本和概率面前做著(zhù)商業(yè)決策的調整,“快”和“實(shí)用”更能滿(mǎn)足大眾的需求。
數據之大,漫無(wú)邊際,無(wú)窮無(wú)盡,包含著(zhù)我們人類(lèi)的一呼一吸,一舉一動(dòng)。處在大數據帝國的前夜,眺望星空,這是個(gè)最好的時(shí)代,因為數據時(shí)代轉折的重要性,不亞于黑猩猩站立起來(lái)行走劃時(shí)代,很多科幻片里的場(chǎng)景會(huì )出現在我們的'日常;這也會(huì )是個(gè)最壞的時(shí)代,因為人類(lèi)最終會(huì )為此走向哪里,只有蒼穹能知道!
當我們擁有海量數據時(shí),絕對的精準不再是我們追求的主要目標,我們樂(lè )于接受數據的紛繁復雜,也只有接受不精確性,我們才能打開(kāi)一扇從未涉足的世界的窗戶(hù)。
————《大數據時(shí)代》
小數據時(shí)代,我們在數據的精準性上花費很多,包括規則和準則、復式記賬的平衡規則、信息系統等等,數據閉環(huán),所以數據具有結構性,所以可以找根尋蹤,找尋問(wèn)題的根源,尋求解決方案。
大數據時(shí)代來(lái)臨,因為數據量的龐大,以及數據背后的繁雜性,以及處理數據的知識IT工程師和計算者,別忘了,擁有數據的是政府和獨角獸商人,所以,他們很難對數據進(jìn)行深度分析,這樣也會(huì )催生各個(gè)領(lǐng)域的數據分析業(yè)務(wù),數據生態(tài)鏈核心就清晰了起來(lái)。
大數據會(huì )取代小數據嗎?這是不可能的事,大數據和中小數據之間的防火墻更會(huì )高筑!
大數據都是基于樣本的非結構性數據,推送到我們面前的數據指引,都已經(jīng)經(jīng)過(guò)了各種算法的粗加工,融入了計算者的各種算法,算法會(huì )因人而異,利用我們過(guò)去的電子痕跡,預測我們的現在和未來(lái),一花一世界。
初期的一大一小,數據的交融,像極了海上的漁網(wǎng),具有強關(guān)聯(lián)性。
數據就像是一個(gè)神奇的鉆石礦,在其首要價(jià)值被發(fā)覺(jué)后,仍能不斷創(chuàng )造價(jià)值。大數據擁有者依賴(lài)技術(shù)專(zhuān)家挖掘數據的價(jià)值,但技術(shù)專(zhuān)家(數據武士)并沒(méi)有想象中那么耀眼,他們在大數據中淘金,發(fā)現了金銀珠寶,可最后卻要把這些財富拱手讓給大數據擁有者。
————《大數據時(shí)代》
當恐龍消失,人類(lèi)慢慢成為了動(dòng)物界的主人。
數據是我們工作、生活中的點(diǎn)滴記錄,它真實(shí)、樸實(shí)無(wú)華,它們也會(huì )有聲音,只是需要有慧眼和思維才能駕馭。
我們只有跨過(guò)數據化、數字化的長(cháng)河,才能開(kāi)啟AI時(shí)代,路途遙遠,主人!
大數據心得體會(huì ) 10
數據已經(jīng)成為一種商業(yè)資本,一項重要的經(jīng)濟投入,可以創(chuàng )造新的經(jīng)濟利益。事實(shí)上,通過(guò)對海量數據進(jìn)行分析,我們可以獲得巨大價(jià)值的產(chǎn)品或服務(wù),或者深刻的洞見(jiàn)。
大數據時(shí)代的思維變革
。1)不是隨機樣本,而是全體數據:在大數據時(shí)代的第一個(gè)轉變就是利用所有數據,而不再僅僅依靠一小部分數據。采樣分析的精確性隨著(zhù)采樣隨機性的增加而大幅提高,但與樣本數量的增加關(guān)系不大。因此樣本選擇的隨機性比樣本數量更加重要。大數據的方法不采用隨機分析法,而是采用所有數據,即樣本=總體。
。2)追求數據的混雜性而不是精確性:大數據為了擴大數據規模允許不精確。大數據的簡(jiǎn)單算法比小數據的復雜算法更加有效。大數據要求我們接受紛繁性,放棄對精確性的追求,在大數據時(shí)代我們無(wú)法獲得精確性。
。3)大數據追求相關(guān)關(guān)系而非因果關(guān)系:通過(guò)監控一個(gè)現象的良好的關(guān)聯(lián)物,相關(guān)關(guān)系可以幫助我們捕捉現在和預測未來(lái)。大數據的相關(guān)關(guān)系分析法更加準確、更快,而且不易受傳統思維模式和特定領(lǐng)域里隱含的固有偏見(jiàn)的影響。建立在相關(guān)關(guān)系分析法上基礎上的預測是大數據的核心。
大數據時(shí)代的商業(yè)變革
。1)一切皆可量化:量化是數據化的核心。我們要的是數據化而不是數字化。數據化是指一種把現象轉變?yōu)榭芍票矸治龅牧炕问降倪^(guò)程。數字化指的是把模擬數據轉換為0和1換算表示的二進(jìn)制碼。
有了大數據的幫助,我們不再會(huì )將世界看作世界是一連串我們認為或是自然或是社會(huì )的現象,我們會(huì )意識到本質(zhì)上世界是由信息構成的。將世界看作信息,看作可以理解的數據海洋,為我們提供了一個(gè)從未有過(guò)的審視現實(shí)的視角。它是一種可以滲透到所有生活領(lǐng)域的世界觀(guān)。
。2)數據的絕大部分價(jià)值都隱藏在表面之下:數據的價(jià)值不僅限于特定用途,它可以為同一目的而被多次使用,也可以用于其他目的。數據的基本用途是為信息的收集和處理提供依據。不同于物質(zhì)的東西,數據的價(jià)值不會(huì )隨著(zhù)它的使用而減少,而是可以不斷地被處理。
數據的創(chuàng )新包括:數據的再利用(采集用戶(hù)的搜索數據判斷用戶(hù)的偏好或發(fā)展趨勢)、重組數據(多個(gè)數據集的總和重組在一起時(shí)比單個(gè)數據集更有價(jià)值)、可擴展數據(使得某種方式收集的單一數據集有多種不同的用途)、數據的折舊值(隨著(zhù)時(shí)間推移,大多數數據都會(huì )失去一部分基本用途但潛在價(jià)值依然強大)、數據廢氣(使用用戶(hù)在網(wǎng)上留下的數字軌跡,如在線(xiàn)交互痕跡,來(lái)改善舊服務(wù))、開(kāi)放數據(開(kāi)放政府數據讓私營(yíng)部門(mén)和社會(huì )大眾訪(fǎng)問(wèn))。
。3)數據、技術(shù)與思維的三足鼎立:大數據價(jià)值鏈的構成為大數據采集掌控、大數據挖掘技術(shù)、大數據思維,F今我們處在大數據時(shí)代的早期,思維和技能是最有價(jià)值的。但最終大部分的價(jià)值還是必須從數據本身中挖掘。大數據公司的多樣性表明了數據價(jià)值的轉移。隨著(zhù)數據價(jià)值轉移到數據擁有者手上,傳統的商業(yè)模式也就被顛覆了。
未來(lái)行業(yè)專(zhuān)家和技術(shù)專(zhuān)家的光芒都會(huì )因為統計數學(xué)家和數據分析家的出現而變暗。因為后者不受舊觀(guān)念的影響,能夠聆聽(tīng)數據發(fā)出的聲音。
大數據決定企業(yè)的競爭力。規模很重要,大規模的公司擁有大量數據以及采集更多數據的能力,而小規模公司則更加靈活,因此中型企業(yè)將會(huì )逐漸消亡。
大數據時(shí)代的管理變革
。1)讓數據主宰一切隱憂(yōu):大數據的核心思想是用規模劇增來(lái)改變現狀,這會(huì )給我們帶來(lái)更多威脅。
在大數據時(shí)代,不管是告知與許可(很多數據在收集時(shí)并無(wú)意用作其他意圖,而最終卻產(chǎn)生了很多創(chuàng )新的`用途)、模糊化(有意識的模糊化可能起到反作用)還是匿名化(大數據促進(jìn)了內容的交叉檢驗),這三大隱私保護策略都失效了。
大數據被濫用于因果分析可能導致罪責的判定是基于對個(gè)人未來(lái)的預測。進(jìn)行個(gè)人罪責推定需要行為人選擇某種特定的行為,他的選擇是造成這個(gè)行為的原因。而大數據并不是建立在因果關(guān)系基礎上的,而是相關(guān)關(guān)系!所以大數據絕不可以用來(lái)進(jìn)行罪責推定!
。2)責任與自由并舉的信息管理:大數據時(shí)代要借助限制信息濫用的規范而不是最初的審查來(lái)防止其泛濫。要想保護個(gè)人隱私就需要個(gè)人數據處理器對其政策和行為承擔更多的責任。
個(gè)人隱私保護從個(gè)人許可到讓數據使用者承擔責任:為了實(shí)現數據二次運用的優(yōu)勢與過(guò)度披露所帶來(lái)的風(fēng)險,監管機制可以決定不同種類(lèi)的個(gè)人數據必須刪除的時(shí)間。再利用的時(shí)間框架則取決于數據內在風(fēng)險和社會(huì )價(jià)值觀(guān)的不同。公司可以利用數據的時(shí)間更長(cháng),但相應的必須為其行為承擔責任以及負有特定時(shí)間之后刪除個(gè)人數據的義務(wù)。我們還可以開(kāi)發(fā)新的技術(shù)促進(jìn)隱私保護。如“差別隱私”:故意將數據模糊處理,促使對大數據庫的查詢(xún)不能顯示精確結果。
在依據大數據技術(shù)作重大決策時(shí)必須保證特定防護措施的到位:(a)公開(kāi)原則。用來(lái)進(jìn)行預測分析的數據和算法必須公開(kāi)。(b)公正原則。具備由第三方專(zhuān)家公證的可靠、有效的算法系統。(c)可反駁原則。明確提出個(gè)人可以對其預測進(jìn)行反駁的具體方式。(d)確保對人的評判依據真實(shí)行為而非大數據分析。
大數據的運作超出我們正常理解范圍。為了防止大數據的預測、運算法則和數據庫變得不透明、不可解釋、不可追蹤,大數據需要被檢測并保持透明度,當然還有使這兩項得以實(shí)現的新型專(zhuān)業(yè)技術(shù)和機構,大數計算法師將會(huì )崛起。
為了保護極具競爭力的大數據市場(chǎng),必須防止壟斷。政府也應該公布其數據。
大數據心得體會(huì ) 11
這本書(shū)里主要介紹的是大數據在現代商業(yè)運作上的應用,以及它對現代商業(yè)運作的影響。
《大數據時(shí)代》這本書(shū)的結構框架遵從了學(xué)術(shù)性書(shū)籍的普遍方式。也既,從現象入手,繼而通過(guò)對現象的解剖提出對這一現象的解釋。然后在通過(guò)解釋在對未來(lái)進(jìn)行預測,并對未來(lái)可能出現的問(wèn)題提出自己看法與對策。
下面來(lái)重點(diǎn)介紹《大數據時(shí)代》這本書(shū)的主要內容。
《大數據時(shí)代》開(kāi)篇就講了google通過(guò)人們在搜索引擎上搜索關(guān)鍵字留下的數據提前成功的預測了美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預測比政府提前將近一個(gè)月,相比之下政府只能夠在流感爆發(fā)一兩個(gè)周之后才可以弄到相關(guān)的數據。同時(shí)google的預測與政府數據的相關(guān)性高達97%,這也就意味著(zhù)google預測數據的置信區間為3%,這個(gè)數字遠遠小于傳統統計學(xué)上的.常規置信區間5%!而這個(gè)數字就是大數據時(shí)代預測結果的相對準確性與事件的可預測性的最好證明!通過(guò)這一事以及其他的案例,維克托提出了在大數據時(shí)代“樣本=總體”的思想。我們都知道當樣本無(wú)限趨近于總體的時(shí)候,通過(guò)計算得到的描述性數據將無(wú)限的趨近于事件本身的性質(zhì)。而之前采取的“樣本t;總體”的做法很大程度上無(wú)法做到更進(jìn)一步的描述事物,因為之前的時(shí)代數據的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來(lái)測量事物。而互聯(lián)網(wǎng)終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數據時(shí)代的主流,同時(shí)大數據時(shí)代本身也是建立在大批量數據的存儲與處理的基礎之上的。
接下來(lái),維克多又通過(guò)了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現過(guò)的相應的文字語(yǔ)句掃描并儲存在詞庫中,所以無(wú)論需要翻譯什么,只要有聯(lián)系google詞庫就會(huì )出現翻譯,雖然有的時(shí)候的翻譯很無(wú)厘頭,但是大多數時(shí)候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數據時(shí)代對準確性的追求并不是特別明顯,但是相反大數據時(shí)代是建立在大數據的基礎住上的,所以大數據時(shí)代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會(huì )湮埋少數有問(wèn)題的數據所帶來(lái)的影響。同時(shí)大量的數據也會(huì )無(wú)限的逼近事物的原貌。
之后,維克托又預測了一個(gè)在大數據時(shí)代催生的重要職業(yè)——數據科學(xué)家,這是一群數學(xué)家、統計學(xué)與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見(jiàn)會(huì )在這一群家伙的面前展現得淋漓盡致。所以為了避免個(gè)人隱私在大數據時(shí)代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業(yè)部門(mén)服務(wù),而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個(gè)人隱私。
無(wú)論如何,大數據時(shí)代將會(huì )到來(lái),不管我們接受還是不接受!
我覺(jué)得《大數據時(shí)代》這本書(shū)寫(xiě)的很好,很值得一讀。因為會(huì )給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數據科學(xué)家”們利用,從而再將相關(guān)數據賣(mài)給各大網(wǎng)店。不過(guò),事實(shí)就是我們將會(huì )成為被預測被引誘的對象。所以說(shuō),小心你在網(wǎng)上留下的痕跡。
我喜歡這本書(shū)是因為它給我展現了一個(gè)新的世界。
大數據心得體會(huì ) 12
《大數據時(shí)代:生活、工作與思維的大變革》由維克托邁爾-舍恩伯格和肯尼思庫克耶所著(zhù)。舍恩伯格曾先后任教于世界最著(zhù)名的幾大互聯(lián)網(wǎng)研究學(xué)府,F任牛津大學(xué)網(wǎng)絡(luò )學(xué)院互聯(lián)網(wǎng)治理與監管專(zhuān)業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監管科研項目負責人,哈佛國家電子商務(wù)研究中網(wǎng)絡(luò )監管項目負責人;曾任新加坡國立大學(xué)李光耀學(xué)院信息與創(chuàng )新策略研究中心主任。并擔任耶魯大學(xué)、芝加哥大學(xué)、弗吉尼亞大學(xué)、圣地亞哥大學(xué)、維也納大學(xué)的客座教授。
1.大數據時(shí)代處理數據理念上的三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關(guān)不要因果;接著(zhù),從萬(wàn)事萬(wàn)物數據化和數據交叉復用的巨大價(jià)值兩個(gè)方面,講述驅動(dòng)大數據戰車(chē)在材質(zhì)和智力方面向前滾動(dòng)的最根本動(dòng)力;最后,作者冷靜描繪了大數據帝國前夜的脆弱和不安,包括產(chǎn)業(yè)生態(tài)環(huán)境、數據安全隱私、信息公正公開(kāi)等問(wèn)題。
2.大數據的核心就是預測。它通常被視為人工智能的一部分,或者更確切地說(shuō),被視為一種機器學(xué)習。但是這種定義是有誤導性的。大數據不是要教機器像人一樣思考。相反,它是把數學(xué)算法運用到海量的數據上來(lái)預測事情發(fā)生的可能性。
3.在大數據時(shí)代,我們可以分析更多的數據,有時(shí)候甚至可以處理和某個(gè)特別現象相關(guān)的所有數據,而不再依賴(lài)于隨機采樣。研究數據如此之多,以至于我們不再熱衷于追求精確度,此外不再熱衷于尋找因果關(guān)系。
4.數據化意味著(zhù)我們要從一切太陽(yáng)底下的事物中汲取信息,甚至包括很多我們以前認為和“信息”根本搭不上邊的事情。
5.對“小數據”而言,最基本、最重要的要求就是減少錯誤,保證質(zhì)量。
6.相比依賴(lài)于小數據和精確性的時(shí)代,大數據因為更強調數據的完整性和混雜性,幫助我們進(jìn)一步接近事實(shí)的真相。
7.建立在相關(guān)關(guān)系分析法基礎上的預測是大數據的核心。
8.“現實(shí)挖掘”這里指的是通過(guò)處理大量來(lái)自手機的數據,發(fā)現和預測人類(lèi)行為。
9.所謂大數據思維,是指一種意識,認為公開(kāi)的數據一旦處理得當就能為千百萬(wàn)人急需解決的問(wèn)題提供答案。
10.大數據的.價(jià)值不再單純來(lái)源于它的基本用途,而更多源于它的二次利用。
11.大數據大大地威脅到了我們的隱私和自由,這都是大數據帶來(lái)的新威脅。但是與此同時(shí),它也加劇了一個(gè)舊威脅:過(guò)于依賴(lài)數據,而數據遠遠沒(méi)有我們所想的那么可靠。
12.面對大數據,保護隱私的核心技術(shù)不再適用了。同樣,通過(guò)大數據預測,對我們的未來(lái)想法而非實(shí)際行為采取懲罰措施,也讓我們惶恐不安,因為這否認了自由意志并傷害了人類(lèi)尊嚴。
13.個(gè)人隱私保護從個(gè)人許可到數據使用者承擔責任的轉變是一個(gè)本質(zhì)上的重大變革。
14.在大數據時(shí)代,關(guān)于公正的概念需要重新定義以維護個(gè)人動(dòng)因的想法:人們選擇自我行為的自由意志。簡(jiǎn)單地說(shuō),就是個(gè)人可以并應該為他們的行為而非傾向負責。
大數據心得體會(huì ) 13
《大數據時(shí)代》是由盛揚燕、周濤翻譯的英國維克托·邁爾——舍恩伯格、肯尼思·庫克耶的一部力作。作者維克托·邁爾——舍恩伯格,被譽(yù)為“大數據時(shí)代的預言家”;譯者周濤,是我國大數據和網(wǎng)絡(luò )科學(xué)領(lǐng)域的青年領(lǐng)軍人物。強強聯(lián)合、中西合璧,使這部中譯本自2013年1月與英文原版同步面世以來(lái),即獲好評如潮。至2015年10月,在短短不到三年時(shí)間里,已加印到第18版,足見(jiàn)其閱讀面之廣、影響力之深。
《大數據時(shí)代》,是我目前最喜歡的一本書(shū)。它點(diǎn)燃了我的“紙質(zhì)閱讀”熱情,引導我從以休閑、娛樂(lè )為主的片斷閱讀轉向了與工作需要相統一的深度閱讀。我是比較愛(ài)讀書(shū)的,但自從去年手機啟用了上網(wǎng)功能后,我對網(wǎng)上閱讀也由最初的好奇逐步發(fā)展為習慣,坐著(zhù)看手機、躺著(zhù)看手機,甚至上廁所都拿著(zhù)手機。但在這樣的閱讀中,思維仿佛禁錮在了手機屏幕的方寸之間,怠于思考。久而久之,思考能力怕是會(huì )退化,甚至只是生活在自己的網(wǎng)絡(luò )空間里,與現實(shí)脫節。對此,我感到警醒和焦慮,一直想從這樣的閱讀習慣中擺脫出來(lái),盡管期間也讀了幾本書(shū),但被動(dòng)閱讀成分居多,直到我讀到《大數據時(shí)代》。這一次,我只用一個(gè)周末兩、三天的時(shí)間就讀完了這本書(shū),閱讀速度堪比早年讀《哈里·波特》。這樣的手不釋卷,這樣的閱讀速度,讓我對自己又有了信心,我還是可以閱讀紙質(zhì)書(shū)的!洞髷祿䲡r(shí)代》字里行間洋溢的時(shí)代氣息深深地感染了我,令我發(fā)自?xún)刃牡乜释私鈺r(shí)事,理解國家、企業(yè)面臨的形勢任務(wù)。于是,捧讀起《中國油氣產(chǎn)業(yè)發(fā)展分析與展望報告藍皮書(shū)》、《中國國情報告》,也同樣興趣盎然。這一刻,我感到我的閱讀興趣與我的工作需要統一起來(lái)了,這是我近年來(lái)一直在努力探索和追求的!洞髷祿䲡r(shí)代》,讓我的生活充滿(mǎn)閱讀快樂(lè )。
喜歡《大數據時(shí)代》,偶然中有必然。本書(shū)語(yǔ)言生動(dòng),內容豐富,可讀性強。特別是上百個(gè)與現實(shí)生活密切相關(guān)、基于大數據應用的鮮活案例,發(fā)人深醒。比如,書(shū)中所舉的排查紐約可能發(fā)生爆炸的沙井蓋(下水道檢修口)案例,就非常有代表性。紐約每年會(huì )發(fā)生多起沙井蓋爆炸,爆炸能使重達300磅的沙井蓋沖上幾層樓的高度,非常危險。為紐約提供電力支持的聯(lián)合愛(ài)迪生電力公司每年都會(huì )對沙井蓋進(jìn)行常規檢查和維修,但因沙井蓋量大,僅在紐約最小的行政區曼哈頓就有大約51000個(gè)沙井蓋和服務(wù)設施,難以及時(shí)發(fā)現爆炸隱患并排除。哥倫比亞大學(xué)的統計學(xué)家魯丁和她的同事,從大數據角度切入,通過(guò)對一些歷史數據的研究,預測出可能會(huì )出現問(wèn)題并且需要維修的沙井蓋,既利于及時(shí)發(fā)現并排除隱患,又有效降低了檢修成本。由此我聯(lián)想到,我們大慶油田經(jīng)過(guò)50多年的`開(kāi)發(fā)建設,水網(wǎng)、電網(wǎng)、油氣網(wǎng)密布。即使沒(méi)有大的事故發(fā)生,也容易出現“跑、冒、滴、漏”的情況。隨著(zhù)歲月的增長(cháng),這樣那樣的問(wèn)題會(huì )更加令人疲于應對。特別是隨著(zhù)燃氣入戶(hù),天然氣管網(wǎng)遍布身邊,一旦發(fā)生事故,直接關(guān)系到居民的生命財產(chǎn)安全,影響人心穩定,影響社會(huì )穩定。若能從大數據角度系統考慮這些安全問(wèn)題,配套完善技術(shù)裝備和手段,及時(shí)收集數據、整理數據,讓數據說(shuō)話(huà),傾聽(tīng)數據聲音,排查事故隱患,必能事半功倍。否則,就會(huì )像愛(ài)迪生電力公司初期“撞大運”式的抽檢沙井蓋那般,即使全員日夜不停地努力工作,也難以有效解決問(wèn)題。
《大數據時(shí)代》提出的觀(guān)點(diǎn),同樣令我眼界大開(kāi)。本書(shū)前瞻性地指出,大數據帶來(lái)的信息風(fēng)暴正在變革我們的生活、工作和思維,大數據開(kāi)啟了一次重大的時(shí)代轉型,并用三個(gè)部分講述了大數據時(shí)代的思維變革、商業(yè)變革和管理變革。以大數據時(shí)代的思維變革為例,本書(shū)明確提出“讓數據‘發(fā)聲’”、“允許不精確”、“知道‘是什么’就夠了”等觀(guān)點(diǎn),非常有沖擊性。尤其是“知道‘是什么’就夠了,沒(méi)必要知道‘為什么’”的觀(guān)點(diǎn),與我們的傳統認知和行為習慣相去甚遠。但仔細想來(lái),卻非常適用、實(shí)用、管用。在這個(gè)越來(lái)越講究效率、越來(lái)越講究速度的時(shí)代,若是對任何事情,都執著(zhù)于探索現象背后的原因,也就是必須在知道為什么的基礎上開(kāi)展下一步工作,難免會(huì )降低工作效率,甚至會(huì )錯失良機。就像上文提到的排查紐約可能發(fā)生爆炸的沙井蓋案例,若魯爾和她的同事糾結于探索因果關(guān)系,總是試圖揭示“為什么”,怕是其有生之年都不能完成該項任務(wù)。也許,作者本身并非不重視“為什么”,只是用這樣的闡釋方式,引起人們對“是什么”的重視。突然想起孔夫子那句頗受爭議的“民可使由之,不可使知之”,想來(lái)以孔子之“仁”,一定沒(méi)有小看“民”的意思,他所關(guān)注和強調的也只是效率?缭2000多年,東西方文化在此相互碰撞、相互佐證,令人嘆為觀(guān)止。
去年召開(kāi)的黨的十八屆五中全會(huì ),從國家戰略層面,做出了實(shí)施大數據戰略的部署和要求。善用大數據、融入新時(shí)代,是我們提高企業(yè)競爭力的重要手段,也是我們貫徹落實(shí)中央精神的重要體現。真誠希望更多人閱讀《大數據時(shí)代》,在盡享閱讀快樂(lè )的同時(shí),關(guān)注大數據、開(kāi)發(fā)大數據、應用大數據,充分釋放數據效能,加快成功腳步,實(shí)現人生精彩,為企業(yè)發(fā)展、國家富強、民族振興做出更大的貢獻。
大數據心得體會(huì ) 14
近期,讀了一本很火的書(shū)—《大數據時(shí)代》,得到了一些知識和思考,大數據是一個(gè)很重要的概念,代表了很重要的趨勢!洞髷祿䲡r(shí)代》一書(shū),闡述和厘清了大數據的基本概念和特點(diǎn),也使得我對金融和大數據有了一些思索。
大數據,是思維、技術(shù)與數據的三足鼎立。大數據不僅指規模龐大的數據,它首先是一種思維方式的變化,其次是對這些數據的處理和應用,是數據、處理技術(shù)與應用三者的統一的一列處理技術(shù),最后,大數據的前提必然是充;ネǖ臄祿旧。
金融沒(méi)有類(lèi)似實(shí)物的物理生產(chǎn)、倉儲、物流等過(guò)程,但其本身是數據的生產(chǎn)、倉儲、挖掘、傳輸、分析和集成。所以大數據對于金融而言,相比其他行業(yè),無(wú)疑是有更巨大的影響力。
大數據的思維方式會(huì )改變傳統金融作業(yè)思維,它首先是會(huì )改變金融信貸業(yè)的抵押文化,推動(dòng)信用變現成為可能和主流。尤其是中國金融行業(yè),有著(zhù)根深蒂固的抵押文化,在貸款的過(guò)程中嚴重依賴(lài)于抵押物,這是中小企業(yè)得不到貸款服務(wù)的很重要原因。抵押文化讓貸款服務(wù)提供方在考量時(shí)思維變得簡(jiǎn)單粗暴。貸款方的考量核心是判斷抵押物品的價(jià)值,確保有相應的價(jià)值空間。
長(cháng)期而言,抵押文化對金融業(yè)發(fā)展有相當負面的影響。要想做到真正的改變就是要強化信用貸款,建立信用機制。真正的安全不是抵
押物,而是人們的信用。我們講大數據對金融影響,首先要有思維上的認識變化。
信用看不見(jiàn),摸不著(zhù),但大數據的方式可以幫助還原一個(gè)人,甚至一群人的信用輪廓,讓個(gè)人或者群體的信用變得金光燦燦,觸手可及。這將是根本性的改變,并產(chǎn)生巨大的影響。 一個(gè)人或者群體的信用好壞取決于很多的變量,而且信用本身不是靜態(tài)的,而是一個(gè)動(dòng)態(tài)的行為特征的體現——資產(chǎn)、收入、消費、個(gè)性、習慣、社交網(wǎng)絡(luò )等等都是會(huì )對信用產(chǎn)生影響。個(gè)體信用正式通過(guò)各種行為決定的,但是體現一個(gè)人的信用的行為并非是全無(wú)規律的。通過(guò)大數據,可以很好地通過(guò)對個(gè)體或者群體的大量信用行為進(jìn)行收集、整理、分析,只要把這些糅合在一起時(shí),會(huì )發(fā)現很多客觀(guān)規律,使得人的信用立體化,從而實(shí)現對于個(gè)體或群體信用的預計。
金融,特別是互聯(lián)網(wǎng)金融,對大數據的使用,天生具有優(yōu)勢;ヂ(lián)網(wǎng)可以在法律和道德所容許的范圍內捕捉信用評估所需要的個(gè)人或群體的'行為信息,并將這些繁雜的信息提供給大數據作業(yè)系統進(jìn)行處理,完成對個(gè)人或群體的信用價(jià)值的評估分析。從這個(gè)角度來(lái)說(shuō),P2P 在對信用大數據的使用方面更有獨特優(yōu)勢,由于 P2P 兩面市場(chǎng)的特點(diǎn),決定了它可以覆蓋更多的用戶(hù),同時(shí)由于充分利用了人人組織的特點(diǎn),可以讓用戶(hù)自己產(chǎn)生數據,從而實(shí)現數據的自我產(chǎn)生和循環(huán)。使得“取之不盡,用之不竭”的數據創(chuàng )新成為現實(shí)。
在可預見(jiàn)的未來(lái),大數據對金融的影響:
金融服務(wù)將進(jìn)一步從粗放式管理向精細化管理轉型。由抵押文化向信用文化轉變更全面的信用體制和風(fēng)險管理體制將會(huì )建立;從“利潤為中心”向“客戶(hù)為中心”轉型。從“關(guān)注整體”向“關(guān)注個(gè)體”轉型。
我們還可以預見(jiàn),真正能帶來(lái)改變的互聯(lián)網(wǎng)金融、大數據金融一定是由深諳互聯(lián)網(wǎng)思維,立足小額信用貸款服務(wù),涉及海量用戶(hù),注重數據資產(chǎn),耐心長(cháng)遠的公司所推動(dòng)的。這有這樣,才是符合大數據的趨勢,才能擁有長(cháng)期的核心競爭力。
馬云指出,中國不缺銀行,但“缺乏一個(gè)對十年以后中國經(jīng)濟成長(cháng)承擔責任的金融機構”.在他看來(lái),阿里巴巴并非在做金融,而是在建立一個(gè)可靠的信用系統!盎ヂ(lián)網(wǎng)擁有著(zhù)大量的數據,今天中國缺的是銀行改造。中國缺的是一套動(dòng)態(tài)的、準確的信用體系,而我們正在做這樣一套信用體系。在我們眼里,企業(yè)沒(méi)有大小、國有民營(yíng)之分,只有有信用、沒(méi)信用之分!
我相信大數據與金融在未來(lái)會(huì )聯(lián)系的越來(lái)越緊密,了解大數據、學(xué)習大數據、應用大數據將對未來(lái)金融產(chǎn)生深遠而有益的影響。
大數據心得體會(huì ) 15
最近鬧的沸沸揚揚的“斯諾登事件”讓我想起前段時(shí)間的暢銷(xiāo)書(shū)《大數據時(shí)代》。
維克托邁爾舍恩伯格在《大數據時(shí)代》一書(shū)中,首先給出了“大數據”的含義:你的一個(gè)習慣動(dòng)作,你的一次消費行為,你的一份就診記錄……文字、方位、溝通等一切事物皆可以量化為數據,不僅人類(lèi)生產(chǎn)和生活中“有意義”的信息海量產(chǎn)生,相比以往呈幾何數級的爆炸式增長(cháng),“無(wú)意義”的數據的膨脹速度也同樣驚人。
數據采集存儲技術(shù)讓所有的一切信息都可能被數據化,互聯(lián)網(wǎng)特別是移動(dòng)互聯(lián)網(wǎng)技術(shù)讓所有的數據可以串聯(lián)起來(lái),無(wú)遺漏數據分析技術(shù)幾乎可以讓所有的數據都派上用場(chǎng)!按髷祿䲡r(shí)代”,沒(méi)有了“有意義”信息和“無(wú)意義”信息的邊界,誰(shuí)能得到信息并善于利用信息,誰(shuí)就會(huì )搶占先機!按髷祿䲡r(shí)代”不僅影響著(zhù)我們每一個(gè)人,甚至連世界經(jīng)濟格局也在醞釀著(zhù)巨大變革。因此,《大數據時(shí)代》的作者認為,大數據從根本上改變我們認識世界和改變世界的方式,開(kāi)啟了一次重大的時(shí)代轉型。
歷史是一面鏡子,照向未來(lái)。毫無(wú)疑問(wèn),已有的大數據也屬于歷史的范疇,但大數據時(shí)代卻是指向未來(lái)的。大數據時(shí)代,我們分析的`數據因為“大”,擺脫了傳統對隨機采樣的依賴(lài),而是面對全體數據;因為所有信息都是“數”,可以不再糾結具體數據的精確度,而是坦然面對信息的混雜;總量每?jì)赡昃涂梢苑,而且這一趨勢還在加速。倘若能夠更有效地組織和使用大數據,人類(lèi)將得到更多的機會(huì )發(fā)揮數據對社會(huì )發(fā)展的巨大推動(dòng)作用。研究證明,人類(lèi)行為93%是可以預測的,成為“已經(jīng)發(fā)生的未來(lái)”。
大數據時(shí)代,決策將日益基于數據和分析而作出,而并非基于經(jīng)驗和直覺(jué)。雖然目前大數據預測的還只是參考答案,不是最終答案,但其威力已經(jīng)顯現。在《大數據時(shí)代》中,作者舉的3個(gè)例子令人印象特別深刻。
一是谷歌僅憑網(wǎng)民留下的相關(guān)痕跡,就能得出與事實(shí)相符度高達97%的結論,2009年比疾控中心提前兩周、具體到了特定的地區和州、準確預測了甲型h1 n1流感的爆發(fā)。2013年,又成功預測了美國流感的暴發(fā)。
二是奧巴馬2008年的選舉,競選團隊里設置了首席數據科學(xué)家,他利用facebook和twitter進(jìn)行數據分析,不但利用社交媒體來(lái)發(fā)布信息,幫助奧巴馬團隊定位目標選民,甚至篩選出一些潛在的競選志愿者。
三是微軟公司通過(guò)大數據分析處理,對新一屆奧斯卡金像獎作出“預言”,結果除“最佳導演”外,其余13項大獎全部命中。
正如維克托教授所說(shuō),我們目前看到的大數據和大數據應用,還只是“冰山的一角”。一定程度上,大數據就是新財富,價(jià)值堪比石油,正因為如此,賽門(mén)鐵克公司的調研報告顯示,全球企業(yè)的信息存儲總量年增67目前包括谷歌、舊m 、微軟、emc,惠普,以及我國的百度、騰訊、阿里巴巴等眾多巨頭,已早早開(kāi)始布局大數據,為在即將來(lái)臨的大數據時(shí)代做好競爭鋪墊。
大數據已經(jīng)滲入到了生活的方方面面,將逐漸成為現代社會(huì )基礎設施的一部分,就像公路、鐵路、港口、水電和通信網(wǎng)絡(luò )一樣不可或缺。更有人說(shuō),大數據是繼邊防、海防、空防之后的第四個(gè)大國博弈的空間。美國奧巴馬政府已經(jīng)把“大數據”上升到了國家戰略的層面,投資2億美元啟動(dòng)“大數據研究和發(fā)展計劃”。
大數據時(shí)代,可以讓人成為上帝,通過(guò)各數據匯總,俯瞰世界中你想知道的任何一面。大數據時(shí)代,也可以讓你困擾不堪,因為你面臨個(gè)人隱私被不斷泄露和基于數據預測偏見(jiàn)的麻煩和危機。美國國家安全局和聯(lián)邦調查局于2007年啟動(dòng)了一個(gè)代號為“棱鏡”的秘密監控項目,劃直接進(jìn)入美國網(wǎng)際網(wǎng)路公司的中心服務(wù)器里挖掘數據、收集情報,包括微軟、雅虎、谷歌、蘋(píng)果等在內的9家國際網(wǎng)絡(luò )巨頭皆參與其中。報道刊出后外界嘩然。保護公民隱私組織予以強烈譴責,表示不管奧巴馬政府如何以反恐之名進(jìn)行申辯,不管多少?lài)鴷?huì )議員或政府部門(mén)支持監視民眾,這些項目都侵犯了公民基本權利。
因此,維克托教授在《大數據時(shí)代》中表達了“數據主宰一切”的隱憂(yōu),并提出了“責任與自由并舉”的信息管理設想,這也是我們在擁抱大數據時(shí)代時(shí)必須思考和解決的問(wèn)題。
【大數據心得體會(huì )】相關(guān)文章:
十大數據折射經(jīng)濟走勢08-13
電視數據的數據論文08-02
數據庫實(shí)例數據庫實(shí)習心得體會(huì )11-06
數據結構心得體會(huì )10-24
大數據即將改造十大行業(yè)10-08
閃存在大容量數據采集系統中的應用08-14