巴西世界盃足球賽激戰(zhàn)正酣,有爆冷出局的,也有意外晉級的。本屆比賽雖然沒有了“預(yù)言帝”章魚保羅,但是預(yù)測比賽結(jié)果已經(jīng)有了新工具——能夠分析數(shù)據(jù)、學(xué)習(xí)思考的人工智慧。目前,百度公司就有這樣一個叫做“百度大腦”的項目,用電腦加上深度學(xué)習(xí)等人工智慧技術(shù)去模擬人腦的思維,這個機(jī)器大腦到底是如何思考的?讓我們一起來看看。——編 者
能做什麼
提高語音識別、圖像搜索準(zhǔn)確率,助力大數(shù)據(jù)應(yīng)用推理預(yù)測
德國奪冠率17%,阿根廷奪冠率12.9%……打開百度的大數(shù)據(jù)引擎,點開世界盃預(yù)測一欄,可以看到每個參賽隊伍的奪冠概率分析——這都是根據(jù)大數(shù)據(jù)實時分析得出的結(jié)果。
這個大數(shù)據(jù)引擎是如何運轉(zhuǎn)的?與人類思考一樣,大數(shù)據(jù)引擎對數(shù)據(jù)的搜索分析及預(yù)測也通過一個機(jī)器大腦——百度大腦來實現(xiàn)。這個“大腦”用電腦模擬人腦神經(jīng)網(wǎng)路,包括模擬人腦學(xué)習(xí)分析的能力,從而通過多層的學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù)進(jìn)行數(shù)據(jù)智慧分析,然後做出預(yù)測。
“從功能上來定義百度大腦,可以説它是以大規(guī)模機(jī)器學(xué)習(xí)和深度學(xué)習(xí)為基礎(chǔ)的人工智慧在搜索引擎中的應(yīng)用,旨在優(yōu)化搜索業(yè)務(wù)和提升用戶體驗。”百度高級副總裁王勁舉例説明,比如目前用戶已經(jīng)不滿足於傳統(tǒng)搜索引擎只能提供網(wǎng)頁連結(jié),他們希望能夠通過搜索引擎來直接找到答案。並且需要更加個性化的搜索體驗,希望使用更加自然的人機(jī)交互方式,比如通過語音圖像等形式讓機(jī)器理解,完成資訊與用戶需求的精準(zhǔn)匹配。據(jù)悉,目前中國每天都有60億次的搜索需求。
目前,通過百度大腦的思考,語音識別的相對錯誤率降低了20%—30%,掃描文本圖像生成漢字文本的相對錯誤率降低了30%,相似圖像搜索效果顯著超過同類産品,通過大數(shù)據(jù)顯著提升廣告點擊率,提升網(wǎng)頁搜索排序品質(zhì)等等。
同時百度大腦也能通過推理決策為大數(shù)據(jù)的應(yīng)用提供助力,社會價值初步顯現(xiàn)。除了預(yù)測世界盃外,還能預(yù)測高考擇校、城市旅遊熱度、景點旅遊舒適度、疾病等。比如,通過“疾病預(yù)測”可以知道所處城市是否處於流感高發(fā)期,大家都去哪個醫(yī)院看病,從而了解當(dāng)前流行病態(tài)勢及未來7天的變化趨勢。
百度大數(shù)據(jù)引擎這樣描述預(yù)測原理:“每天網(wǎng)民在百度搜索大量流行病相關(guān)資訊,匯聚起來就有了統(tǒng)計規(guī)律,經(jīng)過一段時間的積累,可以形成一個個預(yù)測模型,預(yù)測未來疾病的活躍指數(shù)”。分析數(shù)據(jù)形成預(yù)測模型,其中就有百度大腦的“思考”。
怎樣工作
模倣人類大腦的神經(jīng)網(wǎng)路,通過多層次的網(wǎng)路模型結(jié)構(gòu)認(rèn)知事物
今年4月,百度董事長兼首席執(zhí)行官李彥宏首度披露百度大腦這一項目。在王勁看來,百度大腦的應(yīng)運而生,受多方面因素的推動。
“首先是伺服器的能力和雲(yún)計算的能力有了很大突破,數(shù)萬臺伺服器能夠集合起來像一臺伺服器一樣工作。其次是大數(shù)據(jù)的積累達(dá)到了相當(dāng)大的規(guī)模。”王勁分析。2013年全球每天産生25PB(拍字節(jié),資訊計量單位)數(shù)據(jù),相當(dāng)於1500個國家圖書館資訊量總和。網(wǎng)際網(wǎng)路技術(shù)的突飛猛進(jìn)及數(shù)據(jù)庫的積累為人工智慧提供了突破的環(huán)境與機(jī)遇。
“最重要的推動是深度學(xué)習(xí)的不斷演進(jìn)迭代。”王勁介紹,人工智慧的核心是機(jī)器學(xué)習(xí)技術(shù),即通過演算法使機(jī)器能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對新的樣本做智慧識別或?qū)ξ磥碜鲱A(yù)測。從上世紀(jì)80年代末以來,機(jī)器學(xué)習(xí)的發(fā)展大致經(jīng)歷了兩次浪潮:淺層學(xué)習(xí)和深度學(xué)習(xí)。
深度學(xué)習(xí)更接近於人類的學(xué)習(xí)方式,它通過模倣人類大腦行為的神經(jīng)網(wǎng)路,利用更多層次的網(wǎng)路模型結(jié)構(gòu)來收集事物的外形、聲音等資訊,進(jìn)行感知理解並産生相應(yīng)行為。比如,要讓機(jī)器“認(rèn)識”物體,就需要若干層網(wǎng)路,首先要建立最基本的一層人工神經(jīng)元,用來探知物體的邊緣形狀等基本資訊,第二層神經(jīng)元需要將第一層感知到的物體邊緣形狀拼湊起來,認(rèn)知物體形狀。然後第三層進(jìn)一步拼湊資訊從而得出物體整體的形態(tài)。“這些過程都是機(jī)器自主完成的,並不需要工程師在任何環(huán)節(jié)輸入資訊。”王勁強(qiáng)調(diào)。
深度學(xué)習(xí)可以説是人工智慧技術(shù)取得新突破必須邁出的第一步。為此,百度請來了世界三大人工智慧專家之一的吳恩達(dá)。吳恩達(dá)的一個著名的深度學(xué)習(xí)實驗就是讓機(jī)器認(rèn)識了“貓”這種動物:搭建一個1.6萬臺電腦組成的網(wǎng)路,向這個網(wǎng)路展示1000萬段隨機(jī)選取的視頻。經(jīng)過一段時間“學(xué)習(xí)”,該網(wǎng)路在沒有外界干涉的條件下,自己認(rèn)識到“貓”是一種怎樣的動物,並成功找到了貓的照片,識別率為81.7%。吳恩達(dá)坦言,深度學(xué)習(xí)演算法目前還比不上人腦的精確性和靈活性,但相信那一天定會到來。
李彥宏也曾評價,目前百度大腦“大約相當(dāng)於兩到三歲孩子的智力水準(zhǔn)”,但是未來積累10到20年後,根據(jù)摩爾定律的發(fā)展速度,人工智慧的“大腦”可能會發(fā)生質(zhì)變,趕上人腦。
前景幾何
人工智慧技術(shù)得到全世界網(wǎng)際網(wǎng)路巨頭青睞,成為衡量科技創(chuàng)新能力的重要標(biāo)誌
目前,谷歌、IBM、微軟、蘋果、百度這些公司競相開發(fā)深度學(xué)習(xí)技術(shù),投入明顯加大。比如谷歌收購了加拿大多倫多大學(xué)教授傑弗裏·辛頓創(chuàng)建的人工智慧機(jī)構(gòu),紐約大學(xué)數(shù)據(jù)科學(xué)中心的雅恩·立昆教授兼任臉書人工智慧實驗室的主管。
在美國,奧巴馬政府支援籌建一項跨學(xué)科的科研項目“基於神經(jīng)科學(xué)技術(shù)創(chuàng)新的人腦研究”。歐盟2013年初也提出了“人類大腦計劃”,旨在用巨型電腦模擬整個人類大腦。
業(yè)內(nèi)專家認(rèn)為,人工智慧代表了網(wǎng)際網(wǎng)路的未來,是電腦科學(xué)發(fā)展的大勢所趨,是國家産業(yè)變革和升級的重大機(jī)遇。在全球格局的競爭中,如果人工智慧技術(shù)落後,不管是國家還是企業(yè)都處在非常不利的競爭地位。
王勁表示,世界範(fàn)圍內(nèi)的人工智慧競爭中,百度在人才方面與競爭者站在同一起跑線上,技術(shù)上各有短長,“我們要把人才和資源投入到最有希望的方向,大數(shù)據(jù)、深度學(xué)習(xí)是我們看到的最好的突破口。”將大數(shù)據(jù)、深度學(xué)習(xí)作為人工智慧的突破口,百度在該領(lǐng)域的投入已經(jīng)開始有所收穫:不僅提高了搜索、地圖、團(tuán)購等産品的用戶體驗,同時給百度帶來了收入上的提升,“在人工智慧技術(shù)的商業(yè)化方面,百度在全世界範(fàn)圍內(nèi)都是比較領(lǐng)先的。”
“未來百度會把技術(shù)提供給合作夥伴,合作夥伴把他們的數(shù)據(jù)提供給我們,幫助我們提升技術(shù),這是一個共贏的機(jī)會,”王勁説,網(wǎng)際網(wǎng)路正在對中國的經(jīng)濟(jì)帶來很大變化,未來推動網(wǎng)際網(wǎng)路發(fā)展和變革的仍將是技術(shù)。
對於這一點,百度的科學(xué)家們都深信不疑併為之興奮:儘管人類大腦將生物秘密隱藏得還很深,但是“得人工智慧者得天下”的時代已經(jīng)到來了。
[責(zé)任編輯: 林天泉]
近日,浙江義烏一名男子在網(wǎng)上不斷炫富,還用百元大鈔點煙...
關(guān)注臺灣食品油事件