作者:彭科峰 來源:中國科學(xué)報(bào) 發(fā)布時(shí)間:2016/7/12
■本報(bào)記者 彭科峰
在目前的南方大規(guī)模降雨中,百度、阿里巴巴等多家公司利用大數(shù)據(jù),即時(shí)發(fā)布武漢等城市街道積雨?duì)顩r的地圖,提醒出行市民提前避讓。這顯示了大數(shù)據(jù)的巨大威力和前景。
在日前舉辦的中國大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)暨中國電子商務(wù)創(chuàng)新發(fā)展峰會(huì)上,中國工程院院士、中國互聯(lián)網(wǎng)協(xié)會(huì)理事長鄔賀銓向記者表示,大數(shù)據(jù)不能追求以大蓋全,而應(yīng)當(dāng)追求數(shù)據(jù)精準(zhǔn)并強(qiáng)調(diào)規(guī)律?!皩?duì)一個(gè)大數(shù)據(jù)集而言,我們很難要求所有數(shù)據(jù)都精準(zhǔn),但只要大多數(shù)數(shù)據(jù)有代表性,就不妨礙我們利用數(shù)據(jù)集合得到較為準(zhǔn)確的結(jié)果?!?/P>
據(jù)介紹, 2015年、2016年兩年內(nèi),全世界新產(chǎn)生的數(shù)據(jù)量約等于人類有史以來到2014年全球累積數(shù)據(jù)量的總和。鄔賀銓認(rèn)為,大數(shù)據(jù)具有增長性、顆粒性、異構(gòu)性、移動(dòng)性、多維性、隱私性等特點(diǎn)。他以醫(yī)療大數(shù)據(jù)為例介紹說,一個(gè)千萬人口的國內(nèi)城市50年累計(jì)的醫(yī)療數(shù)據(jù)量,預(yù)計(jì)能達(dá)到10PB級(jí)。這些數(shù)據(jù)具有多樣性和碎片化的特點(diǎn),顆粒性大小差別很大。未來,人們需要將這些非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理和儲(chǔ)存。
“我們正加速進(jìn)入大數(shù)據(jù)時(shí)代,但并不是所有數(shù)據(jù)都能開放,而是按照分類來進(jìn)行部分開放?!编w賀銓說,大數(shù)據(jù)有很多來源,包括社會(huì)空間數(shù)據(jù)、物理空間數(shù)據(jù)和信息空間數(shù)據(jù)。比如國家安全數(shù)據(jù)、商業(yè)秘密數(shù)據(jù)、個(gè)人隱私數(shù)據(jù)這三方面的數(shù)據(jù)就不能開放。
《中國科學(xué)報(bào)》 (2016-07-12 第4版 綜合)