提起大數(shù)據(jù),很多人都感覺略知一二;但大數(shù)據(jù)到底是什麼,又很少有人能解釋清楚。今年兩會期間,包括小米科技創(chuàng)始人雷軍、聯(lián)想集團董事長楊元慶、科大訊飛董事長劉慶峰在內(nèi)的多位代表、委員都提出了與大數(shù)據(jù)相關(guān)的建議和提案,他們一方面希望從國家層面推動大數(shù)據(jù)的發(fā)展,另一方面也對它在資訊安全方面可能存在的隱患提出了警示。
大數(shù)據(jù)記錄了所有一切
一份調(diào)查顯示,2013年我國産生的數(shù)據(jù)總量超過0.8ZB,相當於2009年全球的數(shù)據(jù)總量;而到2020年,一個普通中國家庭每年産生的數(shù)據(jù)量,將相當於半個國家圖書館的資訊儲量。
中國電子學會秘書長徐曉蘭委員指出,海量的資訊儲存和挖掘,既是大數(shù)據(jù)的價值所在,也是它有別於傳統(tǒng)網(wǎng)際網(wǎng)路、可能對資訊安全帶來的新隱患。
“大數(shù)據(jù)時代,記錄了很多以往根本不可能或者不需要記錄的數(shù)據(jù),比如微博、朋友圈的內(nèi)容,上網(wǎng)産生的cookie,家庭水電氣使用的情況、汽車和大型設備上安裝的感測器拿到的數(shù)據(jù)等。”社交數(shù)據(jù)分析公司獨到科技的CEO張文浩説,“如果這些資訊都是‘孤島’,影響可能不大。但一旦相互關(guān)聯(lián),影響力會大得驚人。”
中科院資訊工程所所長田靜委員也表示,以往碎片化的數(shù)據(jù)只是盲人摸象,但現(xiàn)在這些碎片全都被存貯起來,通過相關(guān)性分析拼湊,“就知道象到底長什麼樣了”。
技術(shù)上的差距,也造成了大數(shù)據(jù)暫時的“不安全”。
“沒有自己的分析能力,我們怎麼能搞清楚哪些數(shù)據(jù)是需要保護的?”
對於田靜的這個“問題”,國家資訊化專家諮詢委員會副主任、中國工程院院士鄔賀銓提供的一組數(shù)據(jù)給出了答案——數(shù)據(jù)中,大約有一半是應該保護的,但我們現(xiàn)在真正保護的“只有一半的一半”,很多數(shù)據(jù)在有意或無意當中被獲取,“如果這些數(shù)據(jù)整合起來,被某些別有用心的人利用,會對安全造成很大的影響”。
徐曉蘭介紹,目前我國很多機構(gòu)和企業(yè)使用大數(shù)據(jù)分析軟體都是國外廠商生産的,特別是近幾年視頻等多媒體數(shù)據(jù)爆炸性增長,“這些數(shù)據(jù)都是異構(gòu)化的,這部分軟體是我們的短板”。
著名軍事專家尹卓委員則指出,現(xiàn)在網(wǎng)際網(wǎng)路所使用的伺服器大都放在美國,“自己沒有伺服器怎麼可能安全”?
另一方面,在田靜看來,缺乏大數(shù)據(jù)環(huán)境下的安全理念也是重要原因之一。“過去認為無害的資訊,在數(shù)據(jù)爆炸的今天,已經(jīng)完全不一樣了。觀念不改,是沒有秘密可保的。”
張文浩也認為,國人缺乏這方面的意識。“在美國,很多人都會要求不公開自己的隱私,或者主動把自己的數(shù)據(jù)提供給某些特定的機構(gòu)使用;但在國內(nèi)幾乎沒有聽到過,大家也不知道什麼類型的數(shù)據(jù)可能會有多大的風險。”
大數(shù)據(jù)或許也很“危險”
張文浩認為,很多人對於大數(shù)據(jù)的理解都只注意到數(shù)據(jù)的體量和統(tǒng)計,“其實,通過深度分析,從紛繁的數(shù)據(jù)中抽象出規(guī)則和原理,並實現(xiàn)對未來的前瞻性預測,才是大數(shù)據(jù)真正的價值和魅力所在”。
因為大數(shù)據(jù),奧巴馬在2012年成為過去70年來,第一位在失業(yè)率高達7.4%的情況下成功連任的美國總統(tǒng);因為大數(shù)據(jù),Target超市“預測”了18歲少女的懷孕……
任何一項新技術(shù)的背後,都可能懸掛著一把達摩克利斯之劍。大數(shù)據(jù)也是如此,在人們驚嘆于它的“神力”之時,“威脅”也正悄悄逼近。
“前兩年,國外一家情報蒐集機構(gòu)利用國內(nèi)某機構(gòu)人員公開發(fā)表的數(shù)據(jù)和資訊,進行深度挖掘分析,生成了有價值的情報。”徐曉蘭告訴記者,後來經(jīng)過詳細調(diào)查,確認情報確實不是該人員提供,而生成情報的那些數(shù)據(jù)本身也是可公開的。“這在以往幾乎是不可能的,也給我們敲響了警鐘。”
尹卓以戰(zhàn)時的交通流量資訊舉例説,如果不注重數(shù)據(jù)的安全使用,將可能對國家安全帶來隱患。“科索沃戰(zhàn)爭中,南聯(lián)盟的油料庫雖然隱蔽得很好,但美國軍方通過對衛(wèi)星圖中的交通流量進行分析,劃定了大量油罐車經(jīng)常出沒的區(qū)域,在進行精確搜尋,從而一舉炸毀。”
如果您認為這些“危險因素”離自己很遠,那就大錯特錯。
“現(xiàn)在很多智慧手機的應用都要求訪問通訊錄,”鄔賀銓説,很多人覺得自己沒有什麼秘密,就同意了。“但實際上,這不僅會透露自己的大量資訊,也會把很多人置於隱私暴露的危險之下 。”
張文浩也指出,現(xiàn)在很多年輕人都有用手機發(fā)微博或者“簽到”的習慣,“這樣其實會泄漏自己的很多資訊。比如你白天經(jīng)常簽到的位置就很有可能是你的單位,傍晚以後簽的多半是自己家”。
大數(shù)據(jù)正經(jīng)歷成長的煩惱
“要想征服數(shù)據(jù),只有更好地利用它們。”張文浩説,數(shù)據(jù)是一種資源和財富,積累越多,産生的效力也會越大。
這個觀點得到了鄔賀銓的認同。他認為,越想規(guī)避大數(shù)據(jù)帶來的安全風險,越需要蒐集儲存海量的數(shù)據(jù),並進行深入的挖掘分析。“有統(tǒng)計顯示,國內(nèi)數(shù)據(jù)蒐集量不及日本的60%和北美的7%,大量數(shù)據(jù)留這樣白白流逝。”
“企業(yè)掌握的數(shù)據(jù)畢竟有限,而且是局部的。”百度公司董事長李彥宏委員提出了數(shù)據(jù)開放的概念,國家應該把那些不涉及安全的數(shù)據(jù)公開,讓有能力的機構(gòu)進行更好的分析利用。
國家基礎(chǔ)地理資訊中心原總工程師李莉委員指出,有的公共部門掌握了大量公共資訊,這些數(shù)據(jù)是國家基礎(chǔ)資訊的重要組成部分。鄔賀銓強調(diào),這些數(shù)據(jù)“不願與其他部門共用,導致了資訊不完整或重復投資”。
共用數(shù)據(jù)在技術(shù)上是否存在很大的難度?在徐曉蘭看來,現(xiàn)在需要大力發(fā)展的數(shù)據(jù)挖掘、分析方面的技術(shù),但對於數(shù)據(jù)共用本身而言,技術(shù)不是最大的障礙,關(guān)鍵還是利益協(xié)調(diào)。她説幾年前,國土部和銀監(jiān)會準備摸底國家土地資訊,“一開始很多人提出各種各樣的困難,幾乎認為是不可能完成的任務。但後來引入問責等行政手段,得到地方配合,進行得就很順利”。
張文浩認為,建立一個公開、透明、規(guī)範的數(shù)據(jù)市場,將會大大增強數(shù)據(jù)的利用率。但在這個過程中,需要仔細考量什麼樣的數(shù)據(jù)可以進入市場。
這就涉及到立法的問題。“界定‘隱私’和為數(shù)據(jù)進行安全分級,是制定法律法規(guī)時要優(yōu)先考慮的方面。”他指出,“個性化服務和隱私之間是一個博弈。名字、電話、住址……不能什麼都説是隱私,因此需要為數(shù)據(jù)安全分級。簡單地説,通過數(shù)據(jù)分析的經(jīng)驗,我們會知道哪類資訊具有更強的指向性和排他性。這類資訊的安全級別就應該更高。”
(科技日報北京3月11日電)
[責任編輯: 王偉]
近日,浙江義烏一名男子在網(wǎng)上不斷炫富,還用百元大鈔點煙...
關(guān)注臺灣食品油事件