試想一下,我們在高速公路上使用GPS導航時,我們更愿意口述目的地還是手動輸入目的地?未來,語音將極大程度上代替鍵盤,成為我們與計算機交流的主要方式。
隨著深度學習、大數(shù)據(jù)以及云計算在語音識別中的廣泛應用,語音識別的技術得到了長足的進展,在此方面有多年經驗的東芝綜合運用其先進的語音、圖像識別技術并綜合云計算服務,開發(fā)出能夠助力人與人交流的AI技術——“RECAIUS?”。
為了實現(xiàn)人與AI安心、舒適、協(xié)調共存,AI需要具備能夠捕捉人類感知和體驗的判斷。在語音識別方面,即便AI沒有完全聽清人們的語音,也能夠從表情動作中給出恰當?shù)膽穑崿F(xiàn)一對一的簡單會話,還可分辨多個會話組合,通過計算機算法形成文本。為此,東芝開發(fā)出的 RECAIUS? 能夠根據(jù)人的表情、聲音和動作,綜合判斷把握具體意圖和狀況并做出適宜應答?!?/p>
“RECAIUS?” 你身邊的同聲傳譯
試想一下,如果一個以英語為母語的人,他一句普通話也不懂,當他想和一位土生土長的中國人交談,他面臨的選擇有兩個:要么他開始艱難的學習,直到能夠熟練掌握中文;要么他就得雇另一個人來幫他翻譯對話,而有了“RECAIUS?”,就相當于你身邊有一位同聲傳譯。
相對你手機里面其他的翻譯軟件,東芝的“RECAIUS?”具備了同聲傳譯的功能,其不僅可以翻譯多國語言,而且即便是語句間沒有間斷的連續(xù)語音,“RECAIUS?”也能自動判斷適合翻譯的單位,實現(xiàn)智能斷句,然后逐句完成翻譯。面對一些固有名詞被生硬直譯后無法理解的情況,使用者可以登錄固有詞匯或例句,給出應當如何翻譯的指示,“RECAIUS?”就能給出恰當?shù)姆g。
所見即能翻譯 真正的讀圖時代
除了語音識別、交互、翻譯等功能,東芝還開發(fā)了將可視文字信息即時翻譯成其他語言的技術。想象一下,人們出國旅行,來到一家以美味著稱的餐館,卻往往被菜單上的異國文字搞得一頭霧水,如果菜單上又沒有圖片,根本不知道該如何點菜,而東芝的“RECAIUS?”可幫你擺脫這個困境,拿起智能手機對準菜單進行拍攝,東芝“RECAIUS?”可以瞬間把菜品翻譯成母語,讓你輕松點菜。
(圖:抹茶 綠茶 烘焙茶 烏龍茶 玄米茶 中國茶)
但是,人們用相機拍攝圖像時,照片上不只有文字,還有背景、圖案等其他信息,為了能夠清晰地從復雜圖像中辨別出文字信息,東芝開發(fā)出獨有的圖像特征提取技術,可以精準檢測到文字。而這一技術對國外的街景圖像很有效果,“RECAIUS?”可以輕松地從街景的圖像中識別其中的字符串,判斷語言屬性并將字符翻譯成你需要的語言文字顯示在屏幕上。未來我們帶上AR眼鏡,沉浸在異國他鄉(xiāng)的外語世界,或許能夠將眼前充斥著外語的世界轉換成母語來欣賞,會不會是一種非常陌生而又熟悉的景象?
東芝秉承“以人為本”的技術研發(fā)理念
梅木秀雄表示:“隨著科技的進步以及物聯(lián)網(wǎng)IoT(Internet of Things)時代的到來,未來不僅是物與物相連,還有人與人相連以及人與物相連。為了給人們的生活和工作創(chuàng)造更加安心、安全、舒適的環(huán)境,東芝將一如既往地秉承以人為本的理念,開發(fā)越來越智能的AI技術,實現(xiàn)更安全、舒適、人與AI和諧共生的社會?!?/p>
*標注的日期為日文原文發(fā)布日期
*注:RECAIUS是東芝數(shù)字解決方案株式會社在日本的商標以及注冊商標。