大數據的前世今生

欄目:大數據 發(fā)布時間:2020-03-03
分享到:
大數據的前世今生

——來源: 科技日報

  “大數據(big data)”是什么?要回答這個問題首先要看看數據是怎樣產生的。

  在信息化時代里,我們每個人都在貢獻數據。上網、打電話、發(fā)短信、聽歌、拍照片、發(fā)帖子、看視頻,都會產生數據。就像涓涓細流匯聚成江河湖海,“大數據”出現了。

  近年來,數據大爆炸的速度快得驚人,馬云曾感慨地說:“大家還沒搞清PC的時候,移動互聯網來了,還沒搞清移動互聯網的時候,大數據時代來了?!?/span>

  大數據時代來得太快,以至于人們對大數據的定義都有N多種。

  按照美國國家標準與技術研究院(NIST)發(fā)布的研究報告的定義:“大數據是用來描述在我們網絡的、數字的、遍布傳感器的、信息驅動的世界中呈現出數據泛濫的常用詞語。大量數據資源為解決以前不可能解決的問題帶來了可能性?!?/span>

  按照業(yè)界權威高德納咨詢公司(Gartner)的定義:“大數據是需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產?!?/span>

  根據百度百科詞條的定義:“大數據,或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業(yè)經營決策更積極目的的資訊。”

  “大數據”到底有多大?目前通行說法,“大數據”至少要達到PB量級。其中,1PB=22.3萬張DVD光盤的容量,相當于800個人類大腦記憶總量,或90個人身體細胞數目總和。1PB的Mp3歌曲可以連續(xù)播放2000年。

  美國互聯網數據中心指出,互聯網上的數據每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數據是最近幾年才產生的。全世界的工業(yè)設備、汽車、電表等設備上有著無數的數碼傳感器,隨時測量和傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物質的變化,也產生著海量的數據信息。

  早在1980年,著名未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數據贊頌為“第三次浪潮的華彩樂章”。不過,大約從2009年開始,“163大數據”才成為互聯網信息技術行業(yè)的流行詞匯。

  如今,大數據技術可以幫助人們做很多以前做不到的事情。比如,國外某警察局利用大數據預測犯罪的發(fā)生幾率,可以精確到街區(qū)500平方英尺的范圍內,有針對性地預防,從而使該地區(qū)犯罪率明顯下降;某統計學家利用大數據預測總統選舉結果;某大學利用手機定位數據和交通數據建立城市規(guī)劃等。

  大數據時代,海量的數據已經成為一種“礦藏”。據測算,3年前,2011年全球大數據產值51億美元;預計3年后,2017年全球大數據產值將達到534億美元。目前大量“掘金者”在數據的海洋里挖掘、采集、提純、分析,從而得出有價值的信息提供給政務的、商務的以及各個領域的買家,從而形成了大數據產業(yè)生態(tài)圈。

  書同文,車同軌。任何新興產業(yè)要健康發(fā)展,首先要盡快建立大家共同遵守的標準。目前國內外大數據標準化工作已經起步。全國信標委已經對標準化工作進行梳理,從基礎、技術、產品、應用等不同角度及進行分析,形成了大數據標準體系框架,并發(fā)布了《大數據標準化白皮書》。