Global Sources
電子工程專輯
 
電子工程專輯 > 感測器/MEMS
 
 
感測器/MEMS  

利用MEMS麥克風陣列定位與辨識音訊或語音

上網時間: 2015年05月06日     打印版  Bookmark and Share  字型大小:  

關鍵字:MEMS  音訊定位  語音辨識  麥克風  PCM 

作者:Mario Malcangi、Matteo D'Aria,米蘭大學

   Roberto Sannino、Luca Spelgatti,意法半導體

自動語音辨識、語音模式辨識以及發話者辨識與確認等應用對於雜訊十分敏感,訊號源的定位與辨識是音訊和語音訊號擷取處理應用的一個關鍵預處理功能。特別是基於微機電系統(MEMS)的麥克風陣列出現後,麥克風陣列音訊定位方案引起科學、產業和開發社群的廣泛關注。

目前業界正使用MEMS麥克風陣列子系統開發嵌入式音訊定位、自動語音辨識和發話人自動辨識解決方案。聲音辨識與定位是辨識與確認他人身份的基本功能,當我們聽到有人講話時,會將頭轉向發話者,查看發話者。

音源定位是自動語音辨識和發話者辨識系統的一個重要環節,對於提高語音辨識系統的性能至關重要。麥克風陣列可擷取從不同方向傳來的聲音,透過演算法運算使麥克風指向某一個特定方向,放大從該方向擷取到的音訊訊號,同時衰減從其它方向擷取的音訊訊號,整個動作就像一個智慧麥克風。


圖1:音源定位利用麥克風音源互相關性(CC)、相變(PHAT)和最大相似性(ML)處理技術的組合

系統架構

整個系統由以下幾個子系統組成:音源方向測定、資料融合、自動語音辨識和發話者確認。其中,音訊方向測定子系統基於麥克風陣列,執行三個不同的音訊方向估算演算法;資料融合子系統負責推斷方向,自動語音辨識子系統利用傳入的音訊訊號增強主音源訊號強度,衰減主音源周圍的其它音訊訊號。最後,自動發話者確認子系統辨識某些關鍵字,再利用相關特徵與發話者匹配。


圖2:如果語音辨識任務未成功,則回饋給資料融合系統,估算新方向傳入的語音,然後驅動麥克風陣列指向該方向。

語音辨識和發話者辨識

語音特徵擷取(LPC-CEP;線性預測編-倒譜)必須確定語音的端點,將語音分成數個短訊框(每訊框20ms),透過一個DTW模式對準演算法與一組參考語音(範本)匹配。然後,應用歐氏距離(Euclidean distance)測量法進行相似性評估。


圖3:特徵擷取、模式匹配和評分是發話者語音辨識確認任務的主要環節。

發話者身份評分採用的是動態時間歸整近鄰(DTW-KNN)演算法的距離測量方法,即動態時間規整(DTW)測量演算法與近鄰決策(KNN)演算法的合併演算法。這個演算法需要使用均方根、過零率、自動相關和倒譜線性預測係數。使用歐氏距離演算法計算成本函數,使用KNN演算法計算最小距離匹配度k。

MEMS麥克風陣列

採用STM32F4微控制器(MCU)和MEMS麥克風開發一個硬體音訊訊號同步擷取處理子系統,其訊號擷取能力相當於8個取樣速率高達48KHz的麥克風 。


圖4:採用STM32F4 MCU和MEMS麥克風的硬體音訊訊號同步擷取處理子系統。

(下一頁繼續:MEMS技術)


1 • 2 Next Page Last Page



投票數:   加入我的最愛
我來評論 - 利用MEMS麥克風陣列定位與辨識音訊或語...
評論:  
*  您還能輸入[0]個字
*驗證碼:
 
論壇熱門主題 熱門下載
 •   將邁入40歲的你...存款多少了  •  深入電容觸控技術就從這個問題開始
 •  我有一個數位電源的專利...  •  磷酸鋰鐵電池一問
 •   關於設備商公司的工程師(廠商)薪資前景  •  計算諧振轉換器的同步整流MOSFET功耗損失
 •   Touch sensor & MEMS controller  •  針對智慧電表PLC通訊應用的線路驅動器
 •   下週 深圳 llC 2012 關於PCB免費工具的研討會  •  邏輯閘的應用


EE人生人氣排行
 
返回頁首