大數(shù)據(jù),不僅“大”在數(shù)量(科技大觀)--國際--人民網(wǎng)
人民網(wǎng)>>國際>>獨(dú)家稿庫

  

大數(shù)據(jù),不僅“大”在數(shù)量(科技大觀)

曹雨田

2013年01月17日08:32    來源:人民網(wǎng)-人民日?qǐng)?bào)    手機(jī)看新聞

  進(jìn)入21世紀(jì)以來,人類在信息存儲(chǔ)和處理能力方面不斷涌現(xiàn)技術(shù)性的突破,目前被人們熱議和關(guān)注的大數(shù)據(jù)即代表著最新潮流;ヂ(lián)網(wǎng)上每天產(chǎn)生的數(shù)據(jù)如潮水般涌現(xiàn)并被保存,當(dāng)數(shù)據(jù)量達(dá)到一定規(guī)模的時(shí)候,就會(huì)從量變到質(zhì)變,對(duì)人們的日常生活產(chǎn)生巨大影響,進(jìn)而改變組織和社會(huì)的管理方式。    

  事實(shí)上,對(duì)海量數(shù)據(jù)的成功應(yīng)用早已有之。2009年全球爆發(fā)甲型H1N1流感,美國公共衛(wèi)生機(jī)構(gòu)的工作效率輸給了商業(yè)企業(yè)谷歌公司。原因是公共衛(wèi)生機(jī)構(gòu)的官員在統(tǒng)計(jì)疫情傳播的起源和渠道時(shí),使用的是傳統(tǒng)的數(shù)據(jù)反饋方式,獲得的信息比疫情的真實(shí)傳播速度整整滯后了兩周;而谷歌公司通過美國人在網(wǎng)上檢索的海量詞條,迅速且成功地運(yùn)用數(shù)字模型判斷出甲流傳播的途徑和趨勢,為官方提供了及時(shí)有效的數(shù)據(jù)。當(dāng)人們?yōu)檫@個(gè)案例驚嘆的同時(shí),也不得不承認(rèn),《大數(shù)據(jù)時(shí)代:生活、工作和思維的改變》的作者、英國牛津大學(xué)教授維克托·舍恩伯格所斷言的大數(shù)據(jù)時(shí)代已經(jīng)來臨了!    

  提到大數(shù)據(jù)時(shí)代,人們的第一反應(yīng)就是數(shù)據(jù)量大。誠然,人類的信息存量正在以幾何倍數(shù)增加。據(jù)統(tǒng)計(jì),一分鐘內(nèi),僅微博網(wǎng)站推特上新發(fā)的信息條數(shù)就超過10萬條;社交網(wǎng)絡(luò)臉譜上的瀏覽量則超過600萬;到2013年,全世界儲(chǔ)存的信息如果記錄在光盤上,這些光盤疊加起來,高度等于從地球到月球走一趟。用信息爆炸來形容今天的社會(huì)和時(shí)代毫不為過。    

  然而,在舍恩伯格看來,大數(shù)據(jù)的“大”,并不是指數(shù)據(jù)本身絕對(duì)數(shù)量大,而是指處理數(shù)據(jù)所使用的“大”模式:盡可能地收集全面數(shù)據(jù)、完整數(shù)據(jù)和綜合數(shù)據(jù),同時(shí)使用數(shù)學(xué)算法對(duì)其進(jìn)行分析和建模,挖掘出背后的關(guān)系,從而預(yù)測某一事件發(fā)生的概率。美國計(jì)算機(jī)專家迪博德說過,在信息時(shí)代,通過信息加總和數(shù)據(jù)整合,對(duì)個(gè)人信息進(jìn)行分析的穿透力要遠(yuǎn)遠(yuǎn)大于1+1的效果,它不需要對(duì)每個(gè)抽樣樣本進(jìn)行精確提取,卻能獲得比抽樣調(diào)查更加精準(zhǔn)的結(jié)果。通過全數(shù)據(jù)模式推演事物發(fā)展規(guī)律的成功案例已不在少數(shù)。

  目前,人們已越來越多地認(rèn)識(shí)到互聯(lián)網(wǎng)數(shù)據(jù)背后蘊(yùn)涵的科學(xué)、經(jīng)濟(jì)和社會(huì)價(jià)值,把大數(shù)據(jù)模型系統(tǒng)地應(yīng)用到公共商業(yè)服務(wù)中,為政府、企業(yè)或個(gè)人提供服務(wù):對(duì)沖基金通過剖析推特上的數(shù)據(jù)來預(yù)測股市的走勢;亞馬遜公司根據(jù)用戶的查詢記錄來推薦產(chǎn)品;紐約政府使用犯罪數(shù)據(jù)和地圖進(jìn)行城市管理……在中國,數(shù)據(jù)的挖掘也已經(jīng)起步:2012年,阿里巴巴提出大數(shù)據(jù)戰(zhàn)略,旨在通過資源共享與數(shù)據(jù)互通創(chuàng)造商業(yè)價(jià)值;去年“雙十一”銷售熱潮中,以云計(jì)算為基礎(chǔ)的聚石塔服務(wù),對(duì)數(shù)以億萬計(jì)的消費(fèi)者需求信息進(jìn)行捕捉匯總,幫助網(wǎng)商隨時(shí)調(diào)整商品和銷售決策,以提供精準(zhǔn)、有效的服務(wù)。    

  盡管我們看到了大數(shù)據(jù)時(shí)代的無限機(jī)遇,但人類在互聯(lián)網(wǎng)領(lǐng)域不過才走了幾十年。除了要解決個(gè)人隱私和信息安全等問題外,整個(gè)網(wǎng)絡(luò)世界的數(shù)據(jù)仍然是局部的、碎片化的。如果能把散落在各個(gè)國家、各個(gè)機(jī)構(gòu)及個(gè)人手中的數(shù)據(jù)集中起來,那么,大數(shù)據(jù)所能發(fā)揮的作用更會(huì)超越我們的想象。

分享到:
(責(zé)任編輯:楊牧、肖紅)


24小時(shí)排行 | 新聞頻道留言熱帖