巴西世界盃足球賽激戰(zhàn)正酣,有爆冷出局的,也有意外晉級(jí)的。本屆比賽雖然沒(méi)有了“預(yù)言帝”章魚(yú)保羅,但是預(yù)測(cè)比賽結(jié)果已經(jīng)有了新工具——能夠分析數(shù)據(jù)、學(xué)習(xí)思考的人工智慧。目前,百度公司就有這樣一個(gè)叫做“百度大腦”的項(xiàng)目,用電腦加上深度學(xué)習(xí)等人工智慧技術(shù)去模擬人腦的思維,這個(gè)機(jī)器大腦到底是如何思考的?讓我們一起來(lái)看看。——編 者
能做什麼
提高語(yǔ)音識(shí)別、圖像搜索準(zhǔn)確率,助力大數(shù)據(jù)應(yīng)用推理預(yù)測(cè)
德國(guó)奪冠率17%,阿根廷奪冠率12.9%……打開(kāi)百度的大數(shù)據(jù)引擎,點(diǎn)開(kāi)世界盃預(yù)測(cè)一欄,可以看到每個(gè)參賽隊(duì)伍的奪冠概率分析——這都是根據(jù)大數(shù)據(jù)實(shí)時(shí)分析得出的結(jié)果。
這個(gè)大數(shù)據(jù)引擎是如何運(yùn)轉(zhuǎn)的?與人類(lèi)思考一樣,大數(shù)據(jù)引擎對(duì)數(shù)據(jù)的搜索分析及預(yù)測(cè)也通過(guò)一個(gè)機(jī)器大腦——百度大腦來(lái)實(shí)現(xiàn)。這個(gè)“大腦”用電腦模擬人腦神經(jīng)網(wǎng)路,包括模擬人腦學(xué)習(xí)分析的能力,從而通過(guò)多層的學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù)進(jìn)行數(shù)據(jù)智慧分析,然後做出預(yù)測(cè)。
“從功能上來(lái)定義百度大腦,可以説它是以大規(guī)模機(jī)器學(xué)習(xí)和深度學(xué)習(xí)為基礎(chǔ)的人工智慧在搜索引擎中的應(yīng)用,旨在優(yōu)化搜索業(yè)務(wù)和提升用戶體驗(yàn)。”百度高級(jí)副總裁王勁舉例説明,比如目前用戶已經(jīng)不滿足於傳統(tǒng)搜索引擎只能提供網(wǎng)頁(yè)連結(jié),他們希望能夠通過(guò)搜索引擎來(lái)直接找到答案。並且需要更加個(gè)性化的搜索體驗(yàn),希望使用更加自然的人機(jī)交互方式,比如通過(guò)語(yǔ)音圖像等形式讓機(jī)器理解,完成資訊與用戶需求的精準(zhǔn)匹配。據(jù)悉,目前中國(guó)每天都有60億次的搜索需求。
目前,通過(guò)百度大腦的思考,語(yǔ)音識(shí)別的相對(duì)錯(cuò)誤率降低了20%—30%,掃描文本圖像生成漢字文本的相對(duì)錯(cuò)誤率降低了30%,相似圖像搜索效果顯著超過(guò)同類(lèi)産品,通過(guò)大數(shù)據(jù)顯著提升廣告點(diǎn)擊率,提升網(wǎng)頁(yè)搜索排序品質(zhì)等等。
同時(shí)百度大腦也能通過(guò)推理決策為大數(shù)據(jù)的應(yīng)用提供助力,社會(huì)價(jià)值初步顯現(xiàn)。除了預(yù)測(cè)世界盃外,還能預(yù)測(cè)高考擇校、城市旅遊熱度、景點(diǎn)旅遊舒適度、疾病等。比如,通過(guò)“疾病預(yù)測(cè)”可以知道所處城市是否處?kù)读鞲懈甙l(fā)期,大家都去哪個(gè)醫(yī)院看病,從而了解當(dāng)前流行病態(tài)勢(shì)及未來(lái)7天的變化趨勢(shì)。
百度大數(shù)據(jù)引擎這樣描述預(yù)測(cè)原理:“每天網(wǎng)民在百度搜索大量流行病相關(guān)資訊,匯聚起來(lái)就有了統(tǒng)計(jì)規(guī)律,經(jīng)過(guò)一段時(shí)間的積累,可以形成一個(gè)個(gè)預(yù)測(cè)模型,預(yù)測(cè)未來(lái)疾病的活躍指數(shù)”。分析數(shù)據(jù)形成預(yù)測(cè)模型,其中就有百度大腦的“思考”。
怎樣工作
模倣人類(lèi)大腦的神經(jīng)網(wǎng)路,通過(guò)多層次的網(wǎng)路模型結(jié)構(gòu)認(rèn)知事物
今年4月,百度董事長(zhǎng)兼首席執(zhí)行官李彥宏首度披露百度大腦這一項(xiàng)目。在王勁看來(lái),百度大腦的應(yīng)運(yùn)而生,受多方面因素的推動(dòng)。
“首先是伺服器的能力和雲(yún)計(jì)算的能力有了很大突破,數(shù)萬(wàn)臺(tái)伺服器能夠集合起來(lái)像一臺(tái)伺服器一樣工作。其次是大數(shù)據(jù)的積累達(dá)到了相當(dāng)大的規(guī)模。”王勁分析。2013年全球每天産生25PB(拍字節(jié),資訊計(jì)量單位)數(shù)據(jù),相當(dāng)於1500個(gè)國(guó)家圖書(shū)館資訊量總和。網(wǎng)際網(wǎng)路技術(shù)的突飛猛進(jìn)及數(shù)據(jù)庫(kù)的積累為人工智慧提供了突破的環(huán)境與機(jī)遇。
“最重要的推動(dòng)是深度學(xué)習(xí)的不斷演進(jìn)迭代。”王勁介紹,人工智慧的核心是機(jī)器學(xué)習(xí)技術(shù),即通過(guò)演算法使機(jī)器能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對(duì)新的樣本做智慧識(shí)別或?qū)ξ磥?lái)做預(yù)測(cè)。從上世紀(jì)80年代末以來(lái),機(jī)器學(xué)習(xí)的發(fā)展大致經(jīng)歷了兩次浪潮:淺層學(xué)習(xí)和深度學(xué)習(xí)。
深度學(xué)習(xí)更接近於人類(lèi)的學(xué)習(xí)方式,它通過(guò)模倣人類(lèi)大腦行為的神經(jīng)網(wǎng)路,利用更多層次的網(wǎng)路模型結(jié)構(gòu)來(lái)收集事物的外形、聲音等資訊,進(jìn)行感知理解並産生相應(yīng)行為。比如,要讓機(jī)器“認(rèn)識(shí)”物體,就需要若干層網(wǎng)路,首先要建立最基本的一層人工神經(jīng)元,用來(lái)探知物體的邊緣形狀等基本資訊,第二層神經(jīng)元需要將第一層感知到的物體邊緣形狀拼湊起來(lái),認(rèn)知物體形狀。然後第三層進(jìn)一步拼湊資訊從而得出物體整體的形態(tài)。“這些過(guò)程都是機(jī)器自主完成的,並不需要工程師在任何環(huán)節(jié)輸入資訊。”王勁強(qiáng)調(diào)。
深度學(xué)習(xí)可以説是人工智慧技術(shù)取得新突破必須邁出的第一步。為此,百度請(qǐng)來(lái)了世界三大人工智慧專(zhuān)家之一的吳恩達(dá)。吳恩達(dá)的一個(gè)著名的深度學(xué)習(xí)實(shí)驗(yàn)就是讓機(jī)器認(rèn)識(shí)了“貓”這種動(dòng)物:搭建一個(gè)1.6萬(wàn)臺(tái)電腦組成的網(wǎng)路,向這個(gè)網(wǎng)路展示1000萬(wàn)段隨機(jī)選取的視頻。經(jīng)過(guò)一段時(shí)間“學(xué)習(xí)”,該網(wǎng)路在沒(méi)有外界干涉的條件下,自己認(rèn)識(shí)到“貓”是一種怎樣的動(dòng)物,並成功找到了貓的照片,識(shí)別率為81.7%。吳恩達(dá)坦言,深度學(xué)習(xí)演算法目前還比不上人腦的精確性和靈活性,但相信那一天定會(huì)到來(lái)。
李彥宏也曾評(píng)價(jià),目前百度大腦“大約相當(dāng)於兩到三歲孩子的智力水準(zhǔn)”,但是未來(lái)積累10到20年後,根據(jù)摩爾定律的發(fā)展速度,人工智慧的“大腦”可能會(huì)發(fā)生質(zhì)變,趕上人腦。
前景幾何
人工智慧技術(shù)得到全世界網(wǎng)際網(wǎng)路巨頭青睞,成為衡量科技創(chuàng)新能力的重要標(biāo)誌
目前,谷歌、IBM、微軟、蘋(píng)果、百度這些公司競(jìng)相開(kāi)發(fā)深度學(xué)習(xí)技術(shù),投入明顯加大。比如谷歌收購(gòu)了加拿大多倫多大學(xué)教授傑弗裏·辛頓創(chuàng)建的人工智慧機(jī)構(gòu),紐約大學(xué)數(shù)據(jù)科學(xué)中心的雅恩·立昆教授兼任臉書(shū)人工智慧實(shí)驗(yàn)室的主管。
在美國(guó),奧巴馬政府支援籌建一項(xiàng)跨學(xué)科的科研項(xiàng)目“基於神經(jīng)科學(xué)技術(shù)創(chuàng)新的人腦研究”。歐盟2013年初也提出了“人類(lèi)大腦計(jì)劃”,旨在用巨型電腦模擬整個(gè)人類(lèi)大腦。
業(yè)內(nèi)專(zhuān)家認(rèn)為,人工智慧代表了網(wǎng)際網(wǎng)路的未來(lái),是電腦科學(xué)發(fā)展的大勢(shì)所趨,是國(guó)家産業(yè)變革和升級(jí)的重大機(jī)遇。在全球格局的競(jìng)爭(zhēng)中,如果人工智慧技術(shù)落後,不管是國(guó)家還是企業(yè)都處在非常不利的競(jìng)爭(zhēng)地位。
王勁表示,世界範(fàn)圍內(nèi)的人工智慧競(jìng)爭(zhēng)中,百度在人才方面與競(jìng)爭(zhēng)者站在同一起跑線上,技術(shù)上各有短長(zhǎng),“我們要把人才和資源投入到最有希望的方向,大數(shù)據(jù)、深度學(xué)習(xí)是我們看到的最好的突破口。”將大數(shù)據(jù)、深度學(xué)習(xí)作為人工智慧的突破口,百度在該領(lǐng)域的投入已經(jīng)開(kāi)始有所收穫:不僅提高了搜索、地圖、團(tuán)購(gòu)等産品的用戶體驗(yàn),同時(shí)給百度帶來(lái)了收入上的提升,“在人工智慧技術(shù)的商業(yè)化方面,百度在全世界範(fàn)圍內(nèi)都是比較領(lǐng)先的。”
“未來(lái)百度會(huì)把技術(shù)提供給合作夥伴,合作夥伴把他們的數(shù)據(jù)提供給我們,幫助我們提升技術(shù),這是一個(gè)共贏的機(jī)會(huì),”王勁説,網(wǎng)際網(wǎng)路正在對(duì)中國(guó)的經(jīng)濟(jì)帶來(lái)很大變化,未來(lái)推動(dòng)網(wǎng)際網(wǎng)路發(fā)展和變革的仍將是技術(shù)。
對(duì)於這一點(diǎn),百度的科學(xué)家們都深信不疑併為之興奮:儘管人類(lèi)大腦將生物秘密隱藏得還很深,但是“得人工智慧者得天下”的時(shí)代已經(jīng)到來(lái)了。
[責(zé)任編輯: 林天泉]
近日,浙江義烏一名男子在網(wǎng)上不斷炫富,還用百元大鈔點(diǎn)煙...
關(guān)注臺(tái)灣食品油事件