谷歌、百度、微軟等通過大數(shù)據(jù)分析賽果
2014巴西世界盃進入白熱化,與往年世界盃不同,移動支付和移動彩票App的普及,今年“足彩”為大家增加了看球的樂趣。你聽説“買足彩信谷歌”嗎?據(jù)了解,通過大數(shù)據(jù)分析,谷歌準確地預測了世界盃16強比賽的勝利者。與此同時,央視的王牌節(jié)目在報道世界盃時引入了預測世界盃戰(zhàn)果的大數(shù)據(jù)內(nèi)容,百度等網(wǎng)際網(wǎng)路巨頭也紛紛扛起“預測”的大旗。
隨著技術不斷的成熟,除了能預測球賽,大數(shù)據(jù)預測也給我們的生活帶來了新的變化。網(wǎng)友小林之前一直在電商網(wǎng)站上買奶粉,沒想到前幾天購買尿片時,快遞員竟然將自己沒有下單的奶粉帶上,原因是經(jīng)過網(wǎng)站數(shù)據(jù)測算,估計孩子的奶粉快要吃完了,需要的話可直接簽單購買。這是國內(nèi)電商網(wǎng)站首次嘗試的基於大數(shù)據(jù)運算的“預測行銷”。
“成功”預測世界盃16強?
谷歌的雲(yún)計算平臺成功預測了世界盃16強比賽每場比賽的勝利者。據(jù)了解,谷歌使用來自實時體育比賽數(shù)據(jù)公司Opta Sports的數(shù)據(jù),以及由BigQuery工程師喬丹·提加尼開發(fā)的實力排行榜系統(tǒng),更考慮了觀眾熱情程度數(shù)據(jù),以計算出主隊優(yōu)勢,從而預測賽果。此外,谷歌使用這一系統(tǒng)來預測世界盃8強的比賽,結果也驚人地準確:巴西對哥倫比亞,巴西勝概率為71%;法國對德國,法國勝概率為69%;荷蘭對哥斯大黎加,荷蘭勝概率為68%;阿根廷對比利時,阿根廷勝概率為81%。
事實上,對於預測結果,谷歌並不是唯一做出完美預測的公司,百度、微軟必應也進行了預測,大家的共同點都在於是依據(jù)雲(yún)數(shù)據(jù)系統(tǒng)的綜合分析來做出預測。
隨著大數(shù)據(jù)行業(yè)的發(fā)展,谷歌、亞馬遜、阿裏、百度、騰訊,都因為擁有大量的用戶註冊和運營資訊,自然地成為大數(shù)據(jù)公司。各種數(shù)據(jù)的記錄也許看起來是隨機的,但是當這些數(shù)據(jù)由光速電腦進行分析之後,便會揭示出影像、模式、聯(lián)繫和趨勢,不僅可以提高業(yè)務績效,更改變生活。
谷歌、百度等搜索引擎不僅存儲了搜索結果中出現(xiàn)的網(wǎng)路連接,還會儲存用戶搜索關鍵詞的行為,它能夠精準地記錄下人們進行搜索行為的時間、內(nèi)容和方式,在你意識到自己要找什麼之前預測出你的意圖。
猜考題、防疫情 大數(shù)據(jù)無所不能?
去年春節(jié)期間,百度已經(jīng)開始了對於春節(jié)人口流動趨勢的預測;今年清明和五一,百度對全國各大景區(qū)、城市的人流熱度做了預測,其針對2014年高考作文命題方向的預測更是“命中”了全國18套考題中的12套。據(jù)了解,百度的“高考預測”還可以利用歷史搜索數(shù)據(jù)、歷年的錄取分數(shù)、各批次省控線預測全國各個大學的報考熱度、難度,各種專業(yè)的報考趨勢以及本省考生都對哪些專業(yè)、學校感興趣等。百度CEO李彥宏表示,“對數(shù)據(jù)的挖掘整理只是大數(shù)據(jù)技術的初級階段。除了通過大數(shù)據(jù)分析規(guī)律、趨勢,機器必須還要會自主思考才行。”
除了IT企業(yè)計劃的疾病預測、房地産預測、就業(yè)預測、金融預測,我國疾控中心也計劃運用大數(shù)據(jù),提前確定一定規(guī)模的未知疾病,為疫情控制爭取時間。
不過,從目前來看,大數(shù)據(jù)的分析預測能力還遠未完善。2009年,甲型H1N1流感爆發(fā)的幾週前,“谷歌流感趨勢”預測了流感在美國境內(nèi)的傳播,其分析結果甚至具體到特定的地區(qū)和州,並且非常及時,令公共衛(wèi)生官員倍感震驚。不過,2013年,谷歌對於流感的預測與美國疾病控制中心匯總後的結果相比,誇大了幾乎一倍。
業(yè)界認為,未來“大數(shù)據(jù)的精準分析不僅有賴於數(shù)據(jù)資源的擴充,更要基於大數(shù)據(jù)引擎的發(fā)展進步。”據(jù)了解,IBM已推出大數(shù)據(jù)行業(yè)方案,英特爾入股了大數(shù)據(jù)初創(chuàng)企業(yè)Cloudera,還推出了基於Hidoop的“大數(shù)據(jù)引擎”。
專家:
數(shù)據(jù)協(xié)同和隱私問題待解
谷歌、IBM、甲骨文、SAP等企業(yè)在大數(shù)據(jù)領域進行了技術創(chuàng)新,越來越多的國外企業(yè)憑藉技術優(yōu)勢和先行經(jīng)驗進軍大數(shù)據(jù)市場。然而,我國大數(shù)據(jù)産業(yè)發(fā)展仍然處於起步階段。“每一次點擊、觸摸、短信、微信、微博、駕駛、飛行、通話、拍照、購買等都産生數(shù)據(jù)……雖然每天在産生大量數(shù)據(jù),卻沒有顯示出足夠的威力。”賽迪顧問分析師表示,“交通部門有車聯(lián)網(wǎng)、物聯(lián)網(wǎng)、路網(wǎng)監(jiān)控、船聯(lián)網(wǎng)、碼頭車站監(jiān)控等地方的大數(shù)據(jù),衛(wèi)生部門擁有流感法定報告數(shù)據(jù)、全國流感樣病例哨點監(jiān)測和病原學監(jiān)測數(shù)據(jù),公安部門有大量的視頻監(jiān)控數(shù)據(jù),但政府部門幾乎都沒有大數(shù)據(jù)處理和挖掘技術。”
除了網(wǎng)際網(wǎng)路公司,沃爾瑪、中國移動等傳統(tǒng)企業(yè)也掌握著大量用戶數(shù)據(jù),平臺企業(yè)互相獨立地應用數(shù)據(jù)淘金,各取所需,但數(shù)據(jù)的私密佔有嚴重制約著大數(shù)據(jù)的廣泛應用和融合發(fā)展。“大數(shù)據(jù)的協(xié)同可以實現(xiàn)智慧路徑規(guī)劃、運力管理、流感預測、疫苗接種指導、安防追逃等。”
《大數(shù)據(jù)時代》一書中指出,“大數(shù)據(jù)本身探尋的是一種趨勢,而非精準性,若要無限接近統(tǒng)計結果,必須讓大數(shù)據(jù)與精細的傳統(tǒng)統(tǒng)計方法互補,而非兩者相互替代。”
此外,數(shù)據(jù)的隱私問題也仍然待解。谷歌斥鉅資投入的癌癥預測項目中,僅有4%的癌癥患者參與到了臨床試驗數(shù)據(jù)庫項目中,這也就意味著高達96%病患的醫(yī)療和綜合體徵資訊難以被其他醫(yī)療機構或者醫(yī)生輕易獲悉。
[責任編輯: 林天泉]
近日,浙江義烏一名男子在網(wǎng)上不斷炫富,還用百元大鈔點煙...
關注臺灣食品油事件