三大技術(shù)突破,助力國內(nèi)智能語音產(chǎn)業(yè)規(guī)模飛速增長
據(jù)行業(yè)預(yù)測,中國智能語音產(chǎn)業(yè)規(guī)模將達(dá)到101.4億元。而智能語音產(chǎn)業(yè)的快速發(fā)展,將帶動智能家居、智能汽車以及智能穿戴設(shè)備等相關(guān)領(lǐng)域市場規(guī)模增長上千億元。
智能語音市場規(guī)模得以如此神速擴(kuò)張,并且應(yīng)用到多個領(lǐng)域,這必然離不開智能語音技術(shù)的不斷突破。那么,我們當(dāng)前的語音技術(shù)達(dá)到了什么地步?換句話說,能夠?qū)崿F(xiàn)什么樣的人機(jī)互動效果呢?
以歐拉蜜團(tuán)隊(duì)為代表,我們一起來看看這些年國內(nèi)智能語音行業(yè)的技術(shù)突破。

技術(shù)門檻高,首先得保證語音識別準(zhǔn)確率
中國的語音識別研究起始于1958年,由中國科學(xué)院聲學(xué)所利用電子管電路識別10個元音。雖然與國外語音識別研究起步時間同步,但由于當(dāng)時條件的限制,隨后一段時間內(nèi)技術(shù)的進(jìn)展較為緩慢。
較初,我國語音技術(shù)的研究一直以學(xué)術(shù)界為主,隨后才有企業(yè)逐漸涉足這個領(lǐng)域。由于語音識別技術(shù)準(zhǔn)入門檻高、人才稀缺,經(jīng)過多年研究與探索,一些國內(nèi)企業(yè)終于在這個行業(yè)冒頭,形成了“一超多強(qiáng)”的局面。
歐拉蜜團(tuán)隊(duì)在智能語音方面的研究已達(dá)5年。初期,歐拉蜜以設(shè)計(jì)出一個中文理解能力超越Siri 的智能語音助理為目標(biāo),開始投入人工智能相關(guān)研究領(lǐng)域,而長遠(yuǎn)的目標(biāo)則是致力于提供全方位的人機(jī)交互解決方案。
這5年里,歐拉蜜攻破了不少技術(shù)難關(guān)。首先要解決的,就是語音識別的精準(zhǔn)度。
語音人機(jī)交互面臨著多重技術(shù)難題。例如,人聲距離不能過遠(yuǎn)、發(fā)音要標(biāo)準(zhǔn)、環(huán)境要安靜、不能持續(xù)對話、不能被打斷……

(歐拉蜜開發(fā)套件拾音測試視頻截圖)
歐拉蜜團(tuán)隊(duì)重點(diǎn)解決了這些語音識別方面的問題。目前,歐拉蜜的人聲識別準(zhǔn)確度高達(dá)90%,并且可實(shí)現(xiàn)超遠(yuǎn)距離識別(較遠(yuǎn)可準(zhǔn)確識別距離8米的人聲)。
同時,歐拉蜜團(tuán)隊(duì)研發(fā)了具有強(qiáng)抗噪能力的語音識別技術(shù)與核心算法,包括語音活性檢測(Voice Activity Detection | Speech Activity Detection),回聲消除算法(AcousticEcho Cancellation ),噪聲處理算法(Noise Reduction & Cancellation),混響處理算法(Reverberation)等多項(xiàng)專利技術(shù)。
歐拉蜜還為企業(yè)用戶提供深度定制服務(wù),比如對兒童聲音、嘈雜環(huán)境聲音進(jìn)行訓(xùn)練,可達(dá)到特殊要求下的語音識別高準(zhǔn)確度。
難點(diǎn)在于自然語言語義理解和處理
“能穿多少穿多少”,這句話的意思,到底是要你“多穿”呢,還是要你“少穿”呢。同樣的,中文語境下,類似的歧義句還不在少數(shù)。
例如,“中國隊(duì)大敗德國隊(duì)”,不知是中國贏了德國,還是德國贏了中國;“小王跟我請了假”,不知是小王向我請了假,還是小王和我都請了假……那么,在這種歧義的語境下,我們需要更多的信息來明確原句的意思。
比較常見的 NLP/NLU 現(xiàn)有技術(shù)與方案有這么幾種。一是基于關(guān)鍵詞和簡單規(guī)則,但這樣誤抓率高、歧義多,無法精準(zhǔn)抓取參數(shù);二是基于ASR語法的擴(kuò)展,但這種方式描述能力有限,可擴(kuò)展性較低;三是基于統(tǒng)計(jì)的句法分析算法,這種算法準(zhǔn)確率與性能不夠高,且不易處理上下文問題;較后呢,是處理語法擴(kuò)展的編程,但這種程序復(fù)雜度很高。
那么,歐拉蜜是怎么解決這個問題的呢?
歐拉蜜團(tuán)隊(duì)自主研發(fā)的語法描述語言(Syntax Language),可用靈活的規(guī)則來描述說法。同時,依托可全文檢索的結(jié)構(gòu)化知識庫,輔助確定語法參數(shù)的合法性,消除歧義。
歐拉蜜采用了結(jié)合規(guī)則和統(tǒng)計(jì)的有機(jī)算法、時間和數(shù)字識別技術(shù)、以編譯器技術(shù)動態(tài)解析和匹配規(guī)則,能夠?qū)崿F(xiàn)多維度的上下文支持能力,準(zhǔn)確理解用戶的表達(dá)意圖。

(上圖為歐拉蜜語音助手截圖)
例如,當(dāng)用戶連續(xù)輸入“今天上海的天氣”,“北京呢”,“買一張去那里的機(jī)票”。經(jīng)過算法處理以及數(shù)據(jù)庫檢索,歐拉蜜能夠結(jié)合上下文,準(zhǔn)確將“北京呢”理解為“北京今天的天氣如何”,并給出當(dāng)天北京的天氣狀況。
同樣的,歐拉蜜也能獲取較后一句中的“那里”指代的是“北京”,并為用戶反饋當(dāng)?shù)厝ケ本┑臋C(jī)票信息。
以視覺行為偵測技術(shù)為輔助的語音人機(jī)交互
如果人機(jī)交互可以更加“智能”,那么它應(yīng)該擁有哪些能力呢?歐拉蜜團(tuán)隊(duì)進(jìn)一步改進(jìn)了語音機(jī)器人的喚醒功能,使人機(jī)交互更加流暢。
市面上主流的智能音響,目前使用的都是語音喚醒。由于智能音響沒有屏幕,一切功能都是通過語音來操控,喚醒功能也不例外。往往會用一句喚醒話術(shù)(通常是產(chǎn)品的名稱)來作為啟動標(biāo)志,當(dāng)人們對著智能音響說出這句話時,智能音響就會進(jìn)行答復(fù)并開始接收你傳遞給它的信息。
你可能會說,語音喚醒已經(jīng)很方便了,難道還能有什么改進(jìn)余地嗎?
試想一下,日常生活中,當(dāng)我們想要對另一人說話時常常會面向他,這時候,不需要叫對方的名字,對方也知道我們正在與他對話。如果機(jī)器也能做到這樣,那么“語音喚醒”都可以省略掉了。
歐拉蜜正是想賦予語音機(jī)器人這樣“人性化”的功能。因此,歐拉蜜團(tuán)隊(duì)使用聲源定位并結(jié)合視線檢測(Eye Gaze Detection)技術(shù),來幫助機(jī)器人確認(rèn)用戶的說話對象。這樣一來,機(jī)器人們除了知道你在說話,還能夠判斷出你是否是在跟它說話,并自動喚醒。
相關(guān)閱讀:
- ...· “芯創(chuàng)杯”首屆高校未來汽車人機(jī)交互設(shè)計(jì)大賽報(bào)名正式啟動
- ...· 探秘第二屆衛(wèi)藍(lán)山鷹“創(chuàng)新·共享”試驗(yàn)技術(shù)論壇!
- ...· “2018中國半導(dǎo)體生態(tài)鏈大會”在江蘇省盱眙舉行
- ...· 新主題新規(guī)劃,CITE 2019瞭望智慧未來
- ...· 從汽車到工廠,TI毫米波傳感器致力于創(chuàng)造更智能的世界
- ...· 意法半導(dǎo)體(ST)、Cinemo和Valens在CES 2018展上聯(lián)合演示汽車信息娛樂解決方案
- ...· 北京集成電路產(chǎn)業(yè)創(chuàng)新發(fā)展高峰論壇即將在京召開
- ...· 三菱電機(jī)強(qiáng)勢出擊PCIM亞洲2017展
- ...· GPGPU國產(chǎn)替代:中國芯片產(chǎn)業(yè)的空白地帶
- ...· 物聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)中Wi-Fi連接的四個關(guān)鍵因素
- ...· 第三屆中國MEMS智能傳感器產(chǎn)業(yè)發(fā)展大會即將于蚌埠拉開帷幕
- ...· IAIC專項(xiàng)賽演繹“中國芯“應(yīng)用創(chuàng)新,信息安全高峰論壇亮劍海寧
- ...· 智能控制有源鉗位反激
- ...· 解讀5G毫米波OTA 測試技術(shù)
- ...· 多個市場高速增長推動Molex加強(qiáng)汽車領(lǐng)域的發(fā)展
- ...· 中國綠色制造聯(lián)盟成立大會召開在即 政產(chǎn)學(xué)研用共探綠色發(fā)展新模式
- ...· Efinix® 全力驅(qū)動AI邊緣計(jì)算,成功推出Trion™ T20 FPGA樣品, 同時將產(chǎn)品擴(kuò)展到二十萬邏輯單元的T200 FPGA
- ...· 英飛凌亮相進(jìn)博會,引領(lǐng)智慧新生活
- ...· 三電產(chǎn)品開發(fā)及測試研討會北汽新能源專場成功舉行
- ...· Manz亞智科技跨入半導(dǎo)體領(lǐng)域 為面板級扇出型封裝提供化學(xué)濕制程、涂布及激光應(yīng)用等生產(chǎn)設(shè)備解決方案
- ...· 中電瑞華BITRODE動力電池測試系統(tǒng)順利交付北汽新能源
- ...· 中電瑞華FTF系列電池測試系統(tǒng)中標(biāo)北京新能源汽車股份有限公司
- ...· 中電瑞華大功率高壓能源反饋式負(fù)載系統(tǒng)成功交付中電熊貓
- ...· 中電瑞華國際在電動汽車及關(guān)鍵部件測評研討會上演繹先進(jìn)測評技術(shù)
產(chǎn)品快訊更多
企業(yè)新聞更多
- ...· 數(shù)據(jù)采集終端系統(tǒng)設(shè)備
- ...· 簡儀科技踏上新征程
- ...· 易靈思® 宣布 AEC-Q100 資質(zhì)認(rèn)證和汽車系列產(chǎn)品計(jì)劃
- ...· 易靈思® 宣布擴(kuò)充高性能 鈦金系列™ FPGA 產(chǎn)品 鈦金系列產(chǎn)品擴(kuò)充至包含 1M 邏輯單元的 FPGA
- ...· 易靈思® 宣布Trion® Titanium 在臺積電 (TSMC) 16納米工藝節(jié)點(diǎn)流片
- ...· TI杯2019年全國大學(xué)生電子設(shè)計(jì)競賽頒獎典禮在京舉行
- ...· BlackBerry QNX虛擬機(jī)獲得全球首個汽車安全完整性等級(ASIL) ‘D’認(rèn)證
- ...· 威馬汽車選擇BlackBerry助力下一代汽車