麥克風陣列
麥克風陣列(Microphone Array)又名陣列式麥克風(Array Microphone),即設置兩組以上麥克風,並以這些麥克風對音訊進行偵測,所得到的資料交由數字信號處理器(DSP)進行比對,用以還原聲音的原貌,並消除背景雜音。麥克風陣列目前是HD Audio的標準之一。Windows Vista已支援麥克風陣列。
概述
[编辑]此方法在 小波變換 (wavelet transform) 域中進行後濾波,結合線性 Wiener 濾波與非線性相干性濾波器,以利用小波的多解析度特性達成:
- 降低計算負擔;
- 改善傅立葉域濾波於低頻表現不佳的問題;
- 在語音暫停期間抑制雜訊而不影響語音段落。
作者指出,小波域的多頻帶結構能自然地支援子頻帶處理(sub-band processing),從而在時頻域同時實現波束形成與噪聲抑制。
背景
[编辑]在自由手語音通訊 (hands-free communication) 環境中,背景噪聲與混響常導致語音品質下降。 傳統的延遲-加總波束形成 (delay-and-sum beamforming) 雖能抑制非目標方向的聲源,但後續的 Wiener 濾波易造成失真,原因包括:
- 語音與噪聲功率譜估計不準確;
- 低頻區噪聲的高空間相干性;
- 麥克風距離過近導致噪聲相關性上升。
本研究的改進重點是於小波域設計 Wiener 濾波器,並引入基於小波的相干性函數 (wavelet coherence function) 以非線性方式控制噪聲抑制強度。
系統架構
[编辑]假設輸入信號為: 其中 為乾淨語音, 為加性噪聲。 經由小波變換矩陣 後,信號可表示為: 其中 分別為語音、噪聲與受污染信號在小波域的係數。
處理步驟如下:
- 對麥克風訊號進行時間延遲補償;
- 使用小波變換分解為多個子頻帶;
- 進行波束形成 (beamforming);
- 對每個子頻帶執行後濾波;
- 合併結果以重建強化語音。
小波域 Wiener 濾波
[编辑]假設語音與噪聲在小波域中具有對角協方差矩陣,則第 子頻帶的 Wiener 濾波器為: 其輸出估計為: 此濾波器的形式與傅立葉域 Wiener 濾波相同,但透過多解析度分析實現更佳的時頻精度與較低的計算負擔。
小波域相干性濾波
[编辑]為評估兩信號之間的相關程度,定義小波域相干性函數 (wavelet coherence function)。 假設: 則小波相干性函數定義為:
功率譜採用指數平均更新: 其中 為遺忘因子。
非線性濾波規則
[编辑]根據觀察,當語音存在時 ,而在靜音時 。 因此設定閾值 以控制濾波強度: 其中 、。
該非線性濾波器能有效去除語音暫停段的背景噪聲。
結合 Wiener 與 Coherence 濾波
[编辑]為兼顧語音段與靜音段表現,作者提出結合兩者的非線性濾波器: 最終輸出: 此結合法能同時處理相干與非相干噪聲,改善 Wiener 濾波在低頻的效能不足。
實驗與結果
[编辑]- 麥克風數量:6
- 阵列類型:非對稱對數分佈,最小間距
- 採樣頻率:8 kHz
- 小波基底:三階 Daubechies 小波 (db3)
- 評估指標:段式 SNR () 與對數區域比 (Log Area Ratio, LAR)
結果顯示:
- 在語音暫停段,噪聲消除效果顯著;
- 聽覺上無不連續感;
- LAR 顯著下降,表示語音自然度提升。
結論
[编辑]結合小波域的 Wiener 與相干性濾波能達成高效的多麥克風語音增強:
- 在靜音段有效抑制雜訊;
- 在語音段保留細節;
- 運算複雜度低;
- 聽覺主觀評估改善顯著。
該演算法為低成本高效能的語音增強系統提供了實用方案。
外部連結
[编辑]- Acoustic Camera(页面存档备份,存于互联网档案馆), System for online and Real-Time Sound Sources Identification in 2D and 3D
- Fukada's tree(页面存档备份,存于互联网档案馆), in an AES paper about Multichannel Music Recording
- Hamasaki's square(页面存档备份,存于互联网档案馆), in an AES paper about Multichannel Recording Techniques
- HEAD Visor, System for Real-Time Identification of Sound Sources
- Squarehead Technology(页面存档备份,存于互联网档案馆) makes microphone arrays for directive sound pickup for conference and broadcast use.
- Trinnov Audio's SRP microphone array for surround recording
- Dr Theile's OCT array
- hauptmikrofon.de(页面存档备份,存于互联网档案馆), a website about Stereophony, Surround Sound, Binaural and Wave Field Synthesis (WFS)
- Core Sound's TetraMic(页面存档备份,存于互联网档案馆) a first-order Ambisonics microphone using a tetrahedral array