- 相關(guān)推薦
大數據環(huán)境下關(guān)于情報學(xué)發(fā)展的思考
摘要:文章從情報學(xué)學(xué)科體系的角度出發(fā),從理論情報學(xué)、應用情報學(xué)、技術(shù)情報學(xué)、管理情報學(xué)四個(gè)方面展開(kāi)思考,分析了大數據環(huán)境下情報學(xué)的發(fā)展趨勢。
關(guān)鍵詞:大數據時(shí)代 ;情報學(xué);學(xué)科發(fā)展 ;大數據
大數據趨勢產(chǎn)生的深層原因是海量數據的存在和越來(lái)越多的事物是以數據形式存在的。隨著(zhù)計算機技術(shù)全面融入社會(huì )生活,我們的工作、生活,甚至國家經(jīng)濟的發(fā)展都受到了大數據的影響,現在人們已經(jīng)意識到了大數據的重要性。在大數據時(shí)代因素的推動(dòng)下,情報學(xué)的理論研究、研究方法以及情報學(xué)技術(shù)等都將做出新的改變,趨勢預測性情報的分量將繼續加重,情報產(chǎn)生中的跨界合作將增強,但現在我們對大數據環(huán)境下情報學(xué)的發(fā)展研究還遠遠不夠。
一、大數據的內涵及基本特征
1.1 大數據的內涵
按照維基百科的定義:大數據是指所涉及的數據量規模巨大到無(wú)法通過(guò)人工,在合理時(shí)間內達到截取、管理、處理、并整理成為人類(lèi)所能解讀的信息集合。研究機構Gartner的定義:大數據是指需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的海量、高增長(cháng)率和多樣化的信息資產(chǎn)。麥肯錫的定義:大數據是指無(wú)法在一定時(shí)間內用傳統數據庫軟件工具對其內容進(jìn)行采集、存儲、管理和分析的數據集合。
現在越來(lái)越多的領(lǐng)域開(kāi)始關(guān)注和研究大數據,這是因為大數據涉及不同的學(xué)科領(lǐng)域,人們從不同的角度、不同的科學(xué)領(lǐng)域出發(fā),對大數據的定義進(jìn)行了詮釋。到目前為止,大數據尚未形成統一明確的定義。筆者認為,大數據的“大”不單單是指數據的量很大,還指數據無(wú)時(shí)無(wú)刻不在急劇增長(cháng),數據的形式紛繁多樣,另外,數據的覆蓋面很廣泛,數據之間交互頻繁,數據之間相關(guān)關(guān)系復雜,這些都是大數據“大”的表現。
1.2 大數據的基本特征
業(yè)界有人將大數據的特征歸納為“4V”,即數據種類(lèi)繁多(Variety),數據體量巨大(Volume),數據生成和處理速度快或理解為流動(dòng)速度快(Velocity),至于第四個(gè)“V”,有人的理解是價(jià)值密度低或者理解為數據的價(jià)值日益突現(Value),也有人認為大數據具有真實(shí)性(Veracity)的特征。筆者更贊同的是Volume、Velocity、Variety、Value四個(gè)特征。雖然業(yè)界也有很多人贊同上述四個(gè)特征,但是對大數據特征含義的理解卻不盡相同。筆者認為,大數據具有以下特征。
1.2.1 數據的體量巨大。據麥肯錫全球研究院(MGI)估計,2010年,企業(yè)的磁盤(pán)中存儲了超過(guò)7EB字節的新數據;用戶(hù)在個(gè)人PC機和筆記本等設備上的新數據存儲量也超過(guò)了6EB字節。2011年全球的數據量達到18Z。體量巨大是大數據的首要特征。
1.2.2 數據生成速度快,并且數據實(shí)時(shí)變化迅速。在這個(gè)信息化的時(shí)代,數據時(shí)刻在產(chǎn)生,比如銀行交易、淘寶購物、購買(mǎi)車(chē)票、打電話(huà)、檢索資料等,這些行為都可以以數據的形式呈現,而且數據呈指數級增長(cháng)。此外,數據是實(shí)時(shí)變化的,人們對數據的處理速度也提出了更高的要求。
1.2.3 數據種類(lèi)的多樣性,F在大數據涉及的領(lǐng)域非常廣泛,數據的種類(lèi)也趨于多樣化,數據會(huì )以數據文本、數據庫、圖片、動(dòng)畫(huà)、音頻、視頻,甚至是以日志文件、網(wǎng)頁(yè)、電子郵件等多種形式呈現在人們的面前。隨著(zhù)信息技術(shù)的不斷發(fā)展,新的數據來(lái)源和數據形式也在不斷地出現。
1.2.4 數據本身的價(jià)值密度低。大數據時(shí)代,各種數據的生產(chǎn)速度非?,研究員要在冗余的信息中發(fā)現其價(jià)值并不容易。
二、大數據時(shí)代情報學(xué)發(fā)展所面臨的機遇與挑戰
2.1 大數據時(shí)代情報學(xué)發(fā)展所面臨的機遇
2.1.1 為情報學(xué)研究提供豐富的數據資源支持。情報學(xué)中的很多研究方法都是建立在大量數據的基礎之上,在這個(gè)網(wǎng)絡(luò )化和信息化的時(shí)代,人們時(shí)時(shí)刻刻都在以各種各樣的方式生產(chǎn)著(zhù)不同類(lèi)型的數據,如前文提到的圖片、動(dòng)畫(huà)、音頻、視頻、日志文件、網(wǎng)頁(yè)、電子郵件。大數據時(shí)代的到來(lái)為情報學(xué)的研究提供了豐富的數據資源。
2.1.2 完善情報學(xué)學(xué)科技術(shù)。大數據時(shí)代將繼續催生很多新型的產(chǎn)業(yè),基于大數據的數據信息收集、存儲、處理、分析、挖掘技術(shù)都是這個(gè)時(shí)代的產(chǎn)物,例如云計算、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、文本挖掘、意見(jiàn)挖掘、中文分詞和NLP自然語(yǔ)言處理、神經(jīng)網(wǎng)絡(luò )算法、網(wǎng)絡(luò )分析SNA、數據可視化等。這些技術(shù)也為情報學(xué)的學(xué)科技術(shù)研究打下了基礎,甚至很多技術(shù)都可以直接被用到情報學(xué)研究中,如云存儲技術(shù)、云計算技術(shù)等,在大數據時(shí)代,這些計算機互聯(lián)網(wǎng)技術(shù)都可以為情報學(xué)研究所用,它們很好地完善了情報學(xué)學(xué)科技術(shù)。
2.1.3 大數據將助力情報學(xué)新的研究范式和方法論。在大數據時(shí)代,人們所面臨的數據不僅僅體量巨大、類(lèi)型多樣化,而且它們還在以驚人的速度生長(cháng)并發(fā)生著(zhù)實(shí)時(shí)的變化,這些都對情報學(xué)的研究方法提出了新的要求,因此對情報學(xué)研究方法而言,唯有創(chuàng )新才有出路。以前,人們通過(guò)研究獲得準確的情報并供人們使用,而在大數據時(shí)代,情報學(xué)將在研究方法上做出改變:情報學(xué)的研究方法可以轉向研究數據之間的相關(guān)性,并根據數據之間的相關(guān)性得出預測性情報,以供人們決策使用。
2.1.4 擴展情報學(xué)的學(xué)科研究和應用領(lǐng)域。大數據時(shí)代,在多種因素的影響下,情報學(xué)的研究?jì)热莺头秶粩鄶U展。在這個(gè)信息化的時(shí)代,情報學(xué)的發(fā)展離不開(kāi)信息技術(shù)和網(wǎng)絡(luò )技術(shù)的支持,情報的獲取、存儲和處理都會(huì )涉及與其他學(xué)科的交叉合作。比如,在大數據時(shí)代,人們的隱私急需得到保護,因此,信息政策和法律法規必將是社會(huì )科學(xué)研究的一個(gè)重要方向,這也將是情報學(xué)與其他學(xué)科跨界合作的新領(lǐng)域。
2.2 大數據時(shí)代情報學(xué)發(fā)展所面臨的挑戰
2.2.1 價(jià)值密度低,獲取有效信息難度加大。數據信息是情報學(xué)研究的重要基礎,但在大數據時(shí)代,一方面數據的體量巨大,要想從中獲取對所研究主題有用的數據信息不是一件易事;另一方面數據的種類(lèi)多樣,不僅包括部分結構化數據,還包括圖片、音頻、視頻等多種形式的非結構化數據。此外,在大數據時(shí)代,數據信息是實(shí)時(shí)變化的,這些都加大了情報工作人員獲取有效信息的難度,這是情報學(xué)發(fā)展中應該重視的一點(diǎn)。
2.2.2 情報學(xué)學(xué)科研究技術(shù)有待進(jìn)一步開(kāi)發(fā)。在這個(gè)信息技術(shù)高速發(fā)展的時(shí)代,情報學(xué)技術(shù)的發(fā)展形勢不容樂(lè )觀(guān)。由于情報學(xué)知識結構的限制,情報學(xué)很難培育自己的情報網(wǎng)絡(luò )技術(shù),情報學(xué)很多技術(shù)都是采用拿來(lái)主義,把其他領(lǐng)域的技術(shù)直接運用到自己的學(xué)科研究中,但是在大數據時(shí)代,為了保證大數據的價(jià)值,必須對數據進(jìn)行快速有效的處理,而我們現有的情報采集、分析、挖掘、處理等技術(shù)已經(jīng)不再適應現在巨量、多樣化、實(shí)時(shí)變化的大數據環(huán)境。
2.2.3 情報學(xué)科呈現泛化發(fā)展趨勢。隨著(zhù)社會(huì )的發(fā)展,情報學(xué)的發(fā)展環(huán)境也在發(fā)生著(zhù)巨大的變化,情報學(xué)是一門(mén)綜合性的學(xué)科,在情報學(xué)的發(fā)展過(guò)程中,會(huì )出現其研究?jì)热菖c其他學(xué)科交叉的現象。一方面,這種現象使情報學(xué)可以從其他學(xué)科獲取理論、技術(shù)等多方面的支持,在一定程度上促進(jìn)情報學(xué)的學(xué)科發(fā)展;另一方面,在信息和網(wǎng)絡(luò )技術(shù)高速發(fā)展的大數據時(shí)代,這種與其他學(xué)科的“跨界研究”將會(huì )使情報學(xué)的學(xué)科泛化趨勢更加明顯,從而會(huì )導致“過(guò)界研究”,處理好“跨界研究”和“過(guò)界研究”的關(guān)系,將成為文獻信息工作者面臨的一個(gè)重要任務(wù)。
2.2.4 數據信息的管理問(wèn)題將是一大挑戰。大數據時(shí)代,傳統的數據管理方式不再適用,在數據來(lái)源、數據處理方式和數據思維等方面都會(huì )帶來(lái)革命性的變化,如果在情報學(xué)研究中對數據信息管理不當,甚至可能帶來(lái)情報安全危機,因此數據信息的管理問(wèn)題也將是對情報學(xué)的一大挑戰,相應的情報道德規范、情報政策、信息法律法規等是必要的。此外,反競爭情報的研究分量也將加重。
三、大數據環(huán)境下情報學(xué)的發(fā)展展望
情報學(xué)這一學(xué)科的發(fā)展離不開(kāi)情報學(xué)的相關(guān)理論、應用、技術(shù)及情報學(xué)管理這幾方面的內容,情報學(xué)學(xué)科體系主要包括理論情報學(xué)、應用情報學(xué)、技術(shù)情報學(xué)、管理情報學(xué)四個(gè)方面,下面筆者將從情報學(xué)學(xué)科體系角度對大數據環(huán)境下情報學(xué)的發(fā)展進(jìn)行探討。
3.1 理論情報學(xué)的發(fā)展
3.1.1 就情報學(xué)內涵而言,在大數據環(huán)境下,情報學(xué)的內涵將更加豐富。一個(gè)學(xué)科在發(fā)展過(guò)程中往往會(huì )受到不同的環(huán)境、技術(shù)等因素的影響,在大數據時(shí)代,數據信息類(lèi)型呈現出多樣化的特征,情報學(xué)的研究對象也相應地從單一的、結構化的文獻信息轉向了復雜多樣的非結構化的數據,因此,大數據將在一定程度上豐富情報學(xué)的內涵。
3.1.2 就情報學(xué)方法論而言,情報學(xué)的學(xué)科方法可以充分發(fā)揮大數據的優(yōu)勢,發(fā)現和利用數據信息的相關(guān)關(guān)系。在大數據時(shí)代,數據信息體量巨大,并且很多數據都是以碎片化的形式存在,情報學(xué)可以通過(guò)利用數據之間的相關(guān)關(guān)系拓展出新的情報學(xué)研究方法。以情報學(xué)研究方法中的文獻計量學(xué)方法為例,很多學(xué)者利用這個(gè)方法對某個(gè)數據庫中某一學(xué)科領(lǐng)域的文章發(fā)表情況或者文章內容進(jìn)行統計分析研究,假設我們把某個(gè)數據擴大到某一學(xué)科領(lǐng)域相關(guān)的所有數據,或許我們會(huì )有新的發(fā)現。
3.1.3 情報學(xué)學(xué)科理論研究泛化。情報學(xué)是一門(mén)綜合性的學(xué)科,在情報學(xué)的發(fā)展研究中,很多內容會(huì )涉及計算機和網(wǎng)絡(luò )技術(shù),甚至社會(huì )化媒體對情報學(xué)的發(fā)展都有很大的影響,在這種情況下,企業(yè)情報學(xué)、經(jīng)濟情報學(xué)、軍事情報學(xué)、情報行為學(xué)等這樣的情報學(xué)分支和交叉學(xué)科應運而生,這都是情報學(xué)學(xué)科泛化的表現,大數據將帶來(lái)新的研究領(lǐng)域、技術(shù)和方法,情報學(xué)學(xué)科理論研究也將繼續呈現泛化趨勢。
3.2 應用情報學(xué)的發(fā)展
3.2.1 情報分析預測與情報甄別的分量加重。預測是大數據的核心,在大數據的環(huán)境下,情報學(xué)可以充分利用大數據帶來(lái)的新技術(shù)。一方面,大數據時(shí)代的數據價(jià)值密度低,信息冗余量大,這對情報學(xué)的情報甄別是巨大的挑戰;另一方面,可以從多角度發(fā)現并挖掘數據之間的線(xiàn)性關(guān)系和非線(xiàn)性相關(guān)關(guān)系,并在此基礎上進(jìn)行情報分析預測,為研究和決策服務(wù)。
3.2.2 重視情報用戶(hù)的需求,向咨詢(xún)業(yè)進(jìn)軍。情報是可以直接使用或者直接用于決策的,情報應用中更應該以用戶(hù)為中心,情報用戶(hù)的需求不是簡(jiǎn)單的信息收集匯總或是信息堆砌,而是經(jīng)過(guò)深層次的加工處理,直接為用戶(hù)提供可供用戶(hù)做決策使用的成熟的、智能的知識,情報學(xué)應該向咨詢(xún)業(yè)進(jìn)軍。
3.3 技術(shù)情報學(xué)的發(fā)展
3.3.1 大數據時(shí)代的數據信息數據量大。大數據時(shí)代的數據信息數據量巨大、來(lái)源廣泛、種類(lèi)繁多、實(shí)時(shí)變化,并表現出碎片化的特征,這給情報的存儲和采集技術(shù)提出了要求,情報的存儲技術(shù)將在容量大的前提下,增加存儲數據的類(lèi)型,開(kāi)發(fā)新型的數據采集技術(shù)、數據挖掘技術(shù)及多媒體檢索技術(shù)。
3.3.2 大數據環(huán)境下更注重數據之間的相關(guān)關(guān)系。情報學(xué)在這方面的研究技術(shù)還相當薄弱,研究大數據之間相關(guān)關(guān)系的數據模型和情報分析技術(shù)有待開(kāi)發(fā)。
3.4 管理情報學(xué)的發(fā)展
3.4.1 大數據時(shí)代個(gè)人隱私有被二次利用的危險。在經(jīng)濟利益的誘惑下,情報學(xué)研究也會(huì )涉及個(gè)人隱私,為了規范情報的管理,情報學(xué)學(xué)科發(fā)展中有必要從情報倫理和情報政策與法規兩個(gè)方面規范情報的管理與研究。情報道德規范、情報職業(yè)規范、情報素養以及相關(guān)的情報政策、信息法律法規都將得到人們的重視,并相繼出臺或完善。
3.4.2 情報學(xué)的發(fā)展離不開(kāi)人才支持。情報學(xué)是一門(mén)綜合性的學(xué)科,從目前形勢來(lái)看,情報學(xué)相對比較缺乏技術(shù)上的人才。在大數據環(huán)境下,情報學(xué)一定要抓住契機,注重人才在學(xué)科發(fā)展中的作用。
四、結語(yǔ)
大數據將廣泛影響到我們的生活,它將重塑我們的生活、工作以及思維方式,目前,大數據分析思想已經(jīng)推廣到了多個(gè)學(xué)科領(lǐng)域,大數據也為情報學(xué)的發(fā)展開(kāi)辟了一條嶄新的道路。雖然大數據與其他新技術(shù)一樣,必然要經(jīng)歷技術(shù)成熟度曲線(xiàn),但是情報學(xué)的發(fā)展不能過(guò)度依賴(lài)大數據,成為大數據的奴隸,而是應該讓大數據為情報學(xué)發(fā)展所用?傊,我們應該勇于面對、勇于創(chuàng )新,迎接大數據帶來(lái)的挑戰。
參考文獻:
[1] 陶雪嬌,胡曉峰,劉洋.大數據研究綜述[J].系統仿真學(xué)報:增刊,2013:142-146.
[2] 朱東華,張嶷,汪雪鋒,等.大數據環(huán)境下技術(shù)創(chuàng )新管理方法研究[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2013(4):172-180.
[3] 黃曉斌,鐘輝新.大數據時(shí)代企業(yè)競爭情報研究的創(chuàng )新與發(fā)展[J].圖書(shū)與情報,2012(6):9-14.
[4] 宗威,吳鋒.大數據時(shí)代下數據質(zhì)量的挑戰[J].西安交通大學(xué)學(xué)報:社會(huì )科學(xué)版,2013(5):38-43.
[5] 彭蘭.“大數據”時(shí)代:新聞業(yè)面臨的新震蕩[J].編輯之友,2013(1):6-10.
[6] 何非,何克清.大數據及其科學(xué)問(wèn)題與方法的探討[J].武漢大學(xué)學(xué)報:理論版,2014(1):3-12.
[7] 沈浩,黃曉蘭.大數據助力社會(huì )科學(xué)研究:挑戰與創(chuàng )新[J].現代傳播,2013(8):13-18.
[8] 夏蓓麗.“‘2008’網(wǎng)絡(luò )環(huán)境下的情報學(xué)發(fā)展研討會(huì )”綜述[J].社會(huì )科學(xué),2008(12):180-181.
[9] 江俞蓉,張天明.大數據時(shí)代情報學(xué)面臨的挑戰和機遇[J].現代情報,2013(8):58-60.
[10] 王知津,李贊梅,周鵬.二十年以來(lái)我國情報學(xué)學(xué)科體系研究進(jìn)展[J].圖書(shū)館,2012(1):50-54.
[11] 包昌火,王秀玲,李艷.中國情報研究發(fā)展紀實(shí)[J].情報理論與實(shí)踐,2010(1):1-3.
【大數據環(huán)境下情報學(xué)發(fā)展的思考】相關(guān)文章:
數字時(shí)代情報學(xué)發(fā)展展望(筆談)--在數字環(huán)境下實(shí)現知識的組織和03-12
局域網(wǎng)數據庫環(huán)境下數據采集及處理12-24
關(guān)于圖書(shū)情報學(xué)的可持續發(fā)展03-18
在網(wǎng)絡(luò )環(huán)境下中學(xué)美術(shù)教學(xué)評價(jià)的思考與實(shí)驗11-20
對中式快餐發(fā)展的思考12-07
產(chǎn)業(yè)融合下的我國信息產(chǎn)業(yè)發(fā)展戰略思考03-20