Global Sources
電子工程專輯
 
電子工程專輯 > 網路技術
 
 
網路技術  

家庭自動化系統中的語音處理

上網時間: 2007年04月26日     打印版  Bookmark and Share  字型大小:  

關鍵字:家庭網路  home network  echo cancel 

家庭網路已經從個人電腦連網逐漸演化成包含高階安全和自動化應用在內的複雜系統。家庭網路一度曾是高階豪華住宅的專利,但現在已開始在普通家庭中普及。這些網路將暖氣、空調、燈光、家電、娛樂、內部通訊、電信、安全和監控系統整合為一個易於操作的統一網路。

基於語音識別的互動式應用(如合成門禁安全系統及家電控制功能)是家庭自動化網路的主要特點。此類互動式功能仰賴高品質的語音處理技術,包括聲學回音消除、低訊號失真和噪音抑制技術。一個設計良好的家庭自動化系統還必須具備擴展能力,為未來發展預留空間,能夠靈活地支援現場升級,支援互動式應用,易於使用,成本經濟且非常可靠。

本文將探討家庭自動化系統面對的獨特語音品質性能問題和設計挑戰。文中將討論基於語音處理的家庭自動化網路應用,研究有助於降低設計複雜性的關鍵特性和功能,並分析增強性能對成本的影響。

語音處理

家庭自動化市場正從高階豪華家庭進入主流消費群體。儘管目前這一市場仍處於初期階段,研究人員仍預估其市場將超過10億美元。在亞洲、歐洲和北美洲,家庭自動化市場正以每年10%的速度發展。僅歐洲市場,2009年對家庭自動化系統的需求就會成長一倍,達5億美元。隨著市場的發展,家庭自動化系統本身也不斷演進,涉及的技術包括藍牙、Wi-Fi、X10、ZigBee和TCP/IP等。

隨著市場和技術的不斷成熟,高品質語音處理性能對家庭自動化和安全應用變得更加重要。語音互動是統一家庭網路的支撐性技術,廣泛用於控制家電、通訊、安全和娛樂設備。與其它互動方式相較,利用人類語音控制設備將使最終用戶感覺更舒服更自然。

聲學回音消除功能不夠好、環境噪音和訊號失真將使家庭自動化系統更難可靠地運作。若語音處理性能無法達到要求,語音識別功能就無法正確檢測到命令並相應地開/關家電,而語音認證功能也可能失靈,導致用戶無法方便地進入自己家。

電話和內部通訊整合

家庭自動化系統正在整合電話通訊和內部通訊功能。在部份系統設計中,內部通訊面板成為主要的通訊工具,適用於住宅存取監控和免提電話。因此,語音通訊技術正成為整個系統的關鍵。

高品質免提電話的一項重要特性就是全雙工作業和良好的雙方同時通話性能。全雙工系統支援雙向語音訊號同時傳輸,因此交談更自然。而半雙工系統在雙方同時講話時,只允許功率水準高的一方訊號通過,另一方訊號則被切斷。因此同一時間只能有一方的講話被對方聽到,且通話是斷續的,不夠自然。

在全雙工系統中,如果演算法在雙方同時講話的情況下能夠連續匯聚,就能夠獲得良好的聲學回音消除性能。當演算法連續匯聚時,隨著訊號源的移動,演算法會追蹤回音路徑中的變化。如果演算法在雙方同時講話時停止匯聚,當雙方同時講話停止時又恢復匯聚,那麼在演算法重新適應新的回音環境時用戶會聽到突發回音。

對數位免提電話來說,獲得高品質通話的另一項關鍵是編碼/解碼器(CODEC)的選擇。編碼解碼器可完成訊號從數位到類比或類比到數位的轉換。傳統的中等品質數位電話採用窄頻編碼解碼器和8kHz的採樣頻率。寬頻編碼解碼器採樣頻率加倍(16kHz),能採集更多人聲分量,支援更高的語音品質。

設計高性能系統

1. 克服塑料外殼帶來的實體限制

小型內部通訊面板由於不佔用額外空間,因此正廣泛應用於家庭中。但受限的面板尺寸會對塑料外殼的設計、麥克風和揚聲器的選擇、佈局和隔離提出很多限制。

在理想系統中,揚聲器和麥克風間應盡可能良好隔離,才能達到最佳性能。但在小型塑料外殼中,兩者之間較差的隔離將帶來額外的聲學耦合,也意味著更大的回音。

設計人員面臨的挑戰是既要選擇較小的揚聲器以適應塑料外殼中的有限空間,同時又要滿足大輸出音量要求。因此設計人員被迫將小型揚聲器驅動到非線性範圍。這將導致塑料外殼中的總諧波失真增加。

為解決這一問題,設計人員需要能處理回音路徑中更多失真的語音處理解決方案,補償較差的揚聲器性能。能消除線性和非線性回音的演算法允許設計人員驅動更大的揚聲器音量,同時還可將失真降到最小。非線性回音消除器將線性回音消除器殘留的回音訊號與參考訊號進行比較,然後減去估算的頻率成份。

圖1顯示了線性和非線性回音消除的功能結構圖。


圖1:線性和非線性回音消除結構圖

該電路能消除線性回音和非線性失真成分。這樣系統就能避免由於回音路徑中的失真而導致聲學回音消除性能變差。

如果設計人員被迫在非最佳化的塑料外殼設計中使用小型揚聲器,那麼在揚聲器路徑中採用多頻段均衡器也可以提升整體性能。均衡器能夠減輕由於小型揚聲器在低頻時頻率響應差而導致的較大低頻失真(圖2)。


圖2:小型揚聲器的典型頻率響應

好的聲學回音消除器能處理回音路徑中的增益,同時不斷追蹤回音源的變化,而不必退回到半雙工方式。容許回音路徑中較大的增益(至少10dB),設計人員就可以使用更大的揚聲器和更靈敏的麥克風。同時,好的聲學回音消除器能夠在耦合更大的情況下工作,因此還可以減少塑料外殼設計限制。

2. 降低噪音

一些設計人員認為,要獲得高性能,必須使用雙麥克風系統。但為了降低整體材料清單成本和系統總成本,簡化系統設計和演算法調整,目前多數設計都使用一個麥克風。設計人員必須找到能提供良好噪音抑制性能並最小化失真的演算法。

與傳統方法相較,心理聲學噪音抑制技術進一步改善了噪音抑制性能。採用這一技術,系統設計人員能使用一個麥克風以較低成本獲得較高性能。

傳統的噪音抑制法對整個頻譜中的所有訊號進行建模,然後再將不需要的訊號從總訊號中移除,這種方法在抑制噪音的同時也降低了訊號完整性。

心理聲學噪音抑制技術依賴於人類對噪音的感覺,因此僅抑制訊號中人耳最容易注意到的噪音成分。該演算法有別於純噪音訊號和混合語音訊號的噪音。它盡可能地衰減遠離語音訊段中語音分量的噪音成分,同時對於頻段中離語音分量較近的噪音分量則不進行衰減。靠近語音成分的未經衰減噪音分量通常被語音訊號所掩蓋,這意味著最終用戶很少注意到這部份噪音。圖3為心理聲學噪音抑制圖。


圖3:心理聲學噪音抑制盡可能地衰減訊號中那些人耳更容易注意到的噪音分量

設計可擴展的系統

好的家庭自動化系統是可擴展的,能夠根據最終用戶需求的變化進行擴展。同時設計人員只需開發一個平台就可以獲得多種變化,無需每次重新進行硬體設計。

要設計一個可擴展的系統,設計人員需要可編程且可現場升級的語音處理解決方案。要跟上系統的快速演進,持續滿足對新功能和更高性能的需求,這些都是非常關鍵的系統設計要求。圖4為現場可升級語音處理解決方案的範例。


圖4:現場可升級語音處理解決方案的例子,設計人員可以在現有硬體基礎上支援更廣泛的功能

家庭網路的發展,特別是家庭網路在大眾住宅市場的普及,使其越來越仰賴語音技術提供用戶友好的介面。靈活的現場可升級語音處理方案可支援未來系統升級,如錄音、驗證、識別、資訊和提示等新功能。

高階家庭自動化系統都擁有互動式介面並使用語音/語音識別和提示,以方便用戶操作家電產品並提供更高階的家庭安全系統。

語音識別將麥克風捕捉到的聲學訊號轉換為一組命令。語音識別系統的複雜性差別很大,可以根據講話模式(詞與連續語音)、培訓(特定人員聲音相關還是無關)和詞彙量(大或小)來進行區分。

有些系統必須經過訓練以適應用戶聲音、語調和詞彙,從而提高準確度。相較於與用戶聲音無關的系統,此類系統能夠更好地預測正確功能。語音識別演算法的折衷表現為響應時間與詞彙量的大小、整體品質與記憶體容量和處理器速度。支援大詞彙量的演算法需要較長的響應時間。高品質演算法也需要更多記憶體和處理器能力。

認證過程是從語音提示開始的。系統會提示用戶說一段預先編程在系統中的句子或短語。在驗證用戶聲音以後,系統提示用戶輸入密碼。認證過程在不同系統之間的差異可能很大。有些系統僅依賴語音驗證技術,但這些系統更脆弱,因為語音驗證本身容易被錄音所欺騙。其它系統則結合生物特徵和用戶資訊驗證以提供更高的安全性。

高性能語音處理對於保證系統正常工作至關重要。回音、環境噪音和失真大幅影響到語音識別和身份驗證應用的性能。

支援更高整合度

隨著終端功能提升、塑料外殼變得更小更精密,進一步整合的需求非常迫切。由於設計人員必須在更小的外形中實現更多功能,節省電路板空間已成為最重要任務之一。

要設計一個好的系統,整合了編碼解碼器並能利用韌體功能(如DTMF、主叫ID、音訊發生等電信訊號)以取代外部元件的可編程解決方案非常關鍵。此類解決方案能取代目前系統設計中使用的眾多獨立元件。

Zarlink半導體公司開發的系統單晶片元件就瞄準了高性能免提通訊應用,包括家庭自動化系統中的應用。

該公司最新的免提電話解決方案是一個專用的語音處理器,結合了整合雙通道寬頻編碼解碼器和多種介面。這些元件支援高階回音消除、心理聲學噪音抑制、全雙工作業,非常靈活並且現場可升級。該晶片採用的專用軟體演算法,能在雙方同時講話時,也能連續追蹤回音路徑中的變化,可降低背景噪音並保持高話質。

這一解決方案基於靈活的平台,既支援提供基本功能的入門系統,也支援提供高階功能的系統。利用這一現場可升級的解決方案,設計人員可以建構平台性設計,在未來系統升級時不必重新進行硬體設計。

本文小結

一度曾是豪華高級住宅標誌之一的家庭自動化系統,目前正進入普通住宅之中,並將逐漸成為新建及現有家庭的標準。傳統的家庭自動化設計採用非常基本的語音處理技術來提供半雙工免提通話功能。隨著終端整合免提電話功能,且家庭安全系統也依賴語音驗證和識別技術,高性能語音處理解決方案已成為家庭自動化系統設計中的關鍵。

為保持低材料成本並獲得高性能,常用的單麥克風系統需支援高階噪音抑制技術(如心理聲學噪音抑制)的語音處理解決方案來提供比傳統噪音抑制更高的性能並減少失真。

為了在小型塑料外殼內獲得高性能,設計人員必須將小型揚聲器驅動到非線性範圍才能夠滿足人們對語音的要求。能夠解決設計人員問題的演算法必須能夠消除非線性回音並處理回音路徑中的增益和失真。

對可行的語音處理解決方案來說,高整合度、現場可升級能力和靈活性也是關鍵因素。高整合度可降低多個元件介面的複雜性並降低材料清單成本。現場可升級能力和靈活性允許設計人員不必改變硬體即可不斷增加系統功能。

作者:Andre Coucopoulos

語音處理產品行銷經理

Zarlink半導體公司




投票數:   加入我的最愛
我來評論 - 家庭自動化系統中的語音處理
評論:  
*  您還能輸入[0]個字
*驗證碼:
 
論壇熱門主題 熱門下載
 •   將邁入40歲的你...存款多少了  •  深入電容觸控技術就從這個問題開始
 •  我有一個數位電源的專利...  •  磷酸鋰鐵電池一問
 •   關於設備商公司的工程師(廠商)薪資前景  •  計算諧振轉換器的同步整流MOSFET功耗損失
 •   Touch sensor & MEMS controller  •  針對智慧電表PLC通訊應用的線路驅動器
 •   下週 深圳 llC 2012 關於PCB免費工具的研討會  •  邏輯閘的應用


EE人生人氣排行
 
返回頁首