Global Sources
電子工程專輯
 
電子工程專輯 > 嵌入式技術
 
 
嵌入式技術  

高性能語音辨識技術提升人機對話效率

上網時間: 2014年01月07日     打印版  Bookmark and Share  字型大小:  

關鍵字:語音辨識  用戶體驗  可穿戴技術  語音觸發  音訊中樞 

作者:Rob Hatfield,Wolfson首席解決方案架構師

目前人與機器之間的對話依然無法實現流暢的體驗。一直到近來,機器解讀人類語音方面的進展仍未能真的為主流用戶帶來實質好處的地步。如今,隨著以往曾阻礙語音辨識進展的瓶頸取得了突破,在低功耗音訊技術方面的發展也開始擁有改善長久以來人機關係的潛力了。一條通往人-機互動領域的快速創新大道現正展開中,這將以我們與機器互動的方向引領諸多有趣的開發活動,讓這些機器能夠傾聽我們的需求,而且越來越瞭解我們的想法。

語音也許是人類最自然的交流方式,但是將一台機器導入這一過程時則產生對於新型態行為協議的需求,特別是在語音溝通過程中缺少另一方持續提供視覺線索時更為重要。對於早期用戶而言,第一次使用電話通話是相當不順暢的,即使是對當今用戶來說,雙向無線通話斷續的情況也必須加以改善。在這兩種情況下,很快就發展出一些可實現自然溝通的常用方法,主要是因為通話的另一方也是人類用戶。隨著行動用戶面對新的語音辨識介面,他們也面臨著類似於使用更古老通訊方式時的挑戰。

一個更近期的例子是,觸控螢幕的革命顯示出陌生的新介面如果能實現高品質而又具備可為用戶體驗帶來附加價值的特色時,就能順利切入主流應用並實現普遍應用。

因此,這值得我們以一種超越傳統應用的更廣泛意義重新定義語音控制的‘性能’,在將下一代產品需求納入考慮的情況下設計出更多未來可驗證的解決方案。

建構高性能的語音辨識解決方案

過去一直使用非常簡單的性能指標來評估語音辨識解決方案。這些指標通常被轉換為單獨的‘精密度’或者‘命中率’等數值,從根本上來表述可正確辨識字和詞組的概率。在定義‘性能’時,需要一種更廣泛且深思熟慮的方式,反映出語音介面的長期發展潛力,以便為用戶提供像觸控螢幕介面一樣的舒適度與可用性等級。

機器解讀的品質扮演了一項關鍵的角色,從根本上來看,它其實是一種人工智慧,所能提供的功能並不只是基本的字詞辨識而已。存取所有設備的功能也使語音辨識成為觸控螢幕的一種可行替代方案,有趣的是,這也使該技術適用於一個更廣範圍的設備種類,包括像可穿戴技術等更小型的設備。較低的響應延遲以及一種‘無協議’的自然對話模式,即使是在充斥雜訊的環境中也能有效執行任務,同時改善用戶體驗。這必須為系統進行精心設計,使設備級的訊號處理技術能夠與基於雲運算的智慧技術有效地結合,從而將增強的性能強帶給用戶。

移除按鍵

語音辨識目前最大的人體工程學侷限性是必須進行按鍵或者其它機械性啟動,因而限制了它在許多環境中的可用性。這種機械觸發是限制功耗的終極結果。為了保持具有競爭力的電池壽命數值,行動設備中待機功耗的預算都極低,典型的電池電流值只有幾毫安培。當功率預算如此低時,連續地執行語音辨識(或者至少隨意的語音辨識)是不可行的。

截至目前為止,按鍵觸發器為這個問題提供了一種自然的解決方案,它可在按下按鍵前停用語音辨識,而使平均功耗降到最低。然而,目前的語音觸發功能被應用於最新的高階音訊中樞上,因為OEM廠商希望語音辨識功能能夠更靈活且更易於使用。透過顯著地降低語音辨識的平均功耗,甚至使其降至待機模式預算範圍內的水準,從而讓主處理器進入‘休眠’模式。這種大幅降低功耗(通常是一個數量級)的方式,能夠完全消除使用按鍵的必要。

語音觸發器架構的選擇

語音觸發是一個簡短的關鍵字或詞(例如‘hello phone’),它能夠使設備被喚醒並且回應其後輸入的語音。圖1顯示半自主且低功耗的‘長時開啟’(always-on)處理音訊中樞,它為這種語音觸發提供了一個平台。

利用音訊中樞實現‘長時開啟’的語音觸發功能
圖1:利用音訊中樞實現‘長時開啟’的語音觸發功能

(下一頁繼續:語音觸發器架構的選擇)


1 • 2 Next Page Last Page



投票數:   加入我的最愛
我來評論 - 高性能語音辨識技術提升人機對話效率
評論:  
*  您還能輸入[0]個字
*驗證碼:
 
論壇熱門主題 熱門下載
 •   將邁入40歲的你...存款多少了  •  深入電容觸控技術就從這個問題開始
 •  我有一個數位電源的專利...  •  磷酸鋰鐵電池一問
 •   關於設備商公司的工程師(廠商)薪資前景  •  計算諧振轉換器的同步整流MOSFET功耗損失
 •   Touch sensor & MEMS controller  •  針對智慧電表PLC通訊應用的線路驅動器
 •   下週 深圳 llC 2012 關於PCB免費工具的研討會  •  邏輯閘的應用


EE人生人氣排行
 
返回頁首