今天是“國際盲人節(jié)”,自1984年設(shè)立至今,包括我國在內(nèi)的世界各國都會為盲人群體舉辦各種活動,以體現(xiàn)對他們的關(guān)懷。今年的盲人日前夕,百度推出的DuLight(百度小明)展示了用科技改變盲人生活的創(chuàng)想:在一片黑暗中,只有靠觸摸才能感知世界的日子或?qū)⑦^去,“一個24歲面帶微笑的女性”“一把漂亮的紅色椅子”“100%純果汁”……借助這雙科技的眼睛,生活中的物品、場景從圖像轉(zhuǎn)變?yōu)檎Z音,幫助盲人朋友越來越清晰地“看見”這個世界。
>>背景 將盲人生活需求轉(zhuǎn)化為推動力
早在2007年,百度公司便推出百度盲道:一個為方便視障人士上網(wǎng)閱讀資訊、參與社區(qū)互動、聽歌、訪問網(wǎng)際網(wǎng)路上其他相關(guān)網(wǎng)站的特殊入口。在這項功能中,百度新聞搜索、百度網(wǎng)頁搜索、百度MP3搜索、百度貼吧、百度知道、百度百科、Hao123網(wǎng)址導(dǎo)航這7項主要搜索服務(wù)升級為盲道版,在頁面設(shè)計等方面充分考慮視障人士的需求,方便他們使用。
2013年,盲人開發(fā)團隊的負責(zé)人曹軍致信百度CEO李彥宏,希望得到百度的資金和技術(shù)支援,開發(fā)一款盲人讀屏軟體。在百度團隊的幫助下,曹軍的公司成功研發(fā)出了幫助盲人使用手機的讀屏軟體。
在和盲人的接觸中,百度公益的工作人員發(fā)現(xiàn)了譬如人民幣不容易通過盲文識別、不能分辨包裝大小相似的藥盒等更多的制約盲人日常生活的問題,希望通過科技和人工智慧得以解決。因此百度公益聯(lián)合百度研究院、IDL深度學(xué)習(xí)實驗室,將這些盲人實實在在的生活需求轉(zhuǎn)化為推動力,試圖通過圖像識別、大數(shù)據(jù)等技術(shù),打造出一款專門服務(wù)於盲人的硬體。
努力沒有白費,今年9月8日,百度推出了DuLight,展示了百度用科技改變盲人生活的創(chuàng)想。技術(shù)的進步為DuLight的誕生提供了基礎(chǔ),除了原有的獨立手機端應(yīng)用,DuLight加入了輕量級的新型硬體,成功完成向全系列盲人個人助理作業(yè)系統(tǒng)的轉(zhuǎn)變。至此,它將作為盲人新的生活助理和新的搜索服務(wù)的發(fā)起入口。
>>功能 打造盲人的日常生活私人助理
依託“百度大腦”的圖像識別、人臉識別、語音識別以及深度學(xué)習(xí)等相關(guān)核心技術(shù),DuLight被打造成盲人的日常生活私人助理,幫助盲人朋友了解身邊的環(huán)境、進行物品識別、人物辨別,以及錢幣識別等。除此之外,它還可以協(xié)助盲人在緊急或特殊情況下發(fā)起實時的遠端視頻協(xié)助。
面對純牛奶和果汁等無法通過觸摸辨別的商品,通過DuLight的圖像識別功能,只需對準(zhǔn)物品、進行拍照操作,DuLight便能夠準(zhǔn)確快速地將物品資訊傳遞給盲人;紙幣大小差別不大,盲文又不夠清晰,弄不清手裏到底是多少錢,通過圖像識別功能,即使只掃到錢幣的一角,DuLight也能準(zhǔn)確地報出錢幣的面值,幫助盲人朋友購物付款;老朋友已經(jīng)走到面前卻不知道是誰,很難通過聲音辨別對面的陌生人的大致年齡和身份,這些困擾在DuLight的幫助下都可以順利解決。
而在一些複雜的場景中,例如獨自在家時需要找到特定的藥品或需要在路況複雜的地段過馬路時,盲人朋友總是無所適從,而今,通過DuLight,可以一鍵發(fā)起遠端視頻協(xié)助,尋求朋友的幫助,提供幫助者在接受求助後,將獲得盲人朋友同樣的視角,實時語音協(xié)助解決問題。
除此之外,在産品設(shè)計上,通用型界面設(shè)計與界面輔助工具相互配合,便於視弱群體更好地辨識螢?zāi)簧系奈淖峙c圖像。DuLight還實現(xiàn)了盲人友好性語音的交互命令與對話,根據(jù)用戶需求和語言命令執(zhí)行對應(yīng)的功能,為用戶提供可調(diào)節(jié)的語音播報速度,人性化十足。觸摸式硬體功能識別的工業(yè)設(shè)計也使得硬體外觀的紋理設(shè)計更加合理,便於盲人通過觸摸調(diào)整取景角度。
據(jù)百度企業(yè)社會責(zé)任經(jīng)理盧健介紹稱,DuLight目前仍處於初期研發(fā)階段,後期將通過不斷的迭代加入更多先進的技術(shù)和功能,以便更好地為盲人群體服務(wù)。
>>揭秘
1.圖像識別
圖像識別技術(shù)是指,通過電腦辨識圖像內(nèi)容並提取語義資訊的過程,典型的任務(wù)包括物體識別、物體檢測、圖像分類標(biāo)注等。它在圖像類數(shù)據(jù)的智慧化分析管理中扮演著至關(guān)重要的角色。
百度通過長期的努力,已經(jīng)構(gòu)築了一套比較完整的圖像識別系統(tǒng),除了能夠有效地處理特定物體的檢測識別(如人臉、文字或是商品),還實現(xiàn)了圖像的分類標(biāo)注、圖文綜合理解的對話型識別,以及主觀圖像品質(zhì)評估等應(yīng)用。
2.人臉識別
人與人之間大量的互動讓人臉識別成了最為實用的圖像識別細分領(lǐng)域。相比于無領(lǐng)域限制的圖像識別,聚焦在人臉上的識別技術(shù)顯然能夠做到更加精準(zhǔn)與高效。
百度現(xiàn)有的人臉識別技術(shù)已經(jīng)具備了很強的識別用戶的能力,這項技術(shù)可以對用戶的性別、年齡、面部表情等特徵進行辨識,還可以區(qū)分不同的用戶。
3.語音識別
Dulight採用領(lǐng)先的DNN聲學(xué)模型,使得語音識別更加精準(zhǔn)。基於大量語言模型建立起來的語音識別系統(tǒng),能夠?qū)崿F(xiàn)更好的人機互動。海量文本語料做基礎(chǔ),同時對文本庫進行實時更新,提升語音識別的效率和品質(zhì)。 (于文)
[責(zé)任編輯: 李振]
近日,浙江義烏一名男子在網(wǎng)上不斷炫富,還用百元大鈔點煙...
關(guān)注臺灣食品油事件