跳转到内容

麥克風陣列

本页使用了标题或全文手工转换
维基百科,自由的百科全书

麥克風陣列(Microphone Array)又名陣列式麥克風(Array Microphone),即設置兩組以上麥克風,並以這些麥克風對音訊進行偵測,所得到的資料交由數字信號處理器(DSP)進行比對,用以還原聲音的原貌,並消除背景雜音。麥克風陣列目前是HD Audio的標準之一。Windows Vista已支援麥克風陣列。

概述

[编辑]

此方法在 小波變換 (wavelet transform) 域中進行後濾波,結合線性 Wiener 濾波與非線性相干性濾波器,以利用小波的多解析度特性達成:

  • 降低計算負擔;
  • 改善傅立葉域濾波於低頻表現不佳的問題;
  • 在語音暫停期間抑制雜訊而不影響語音段落。

作者指出,小波域的多頻帶結構能自然地支援子頻帶處理(sub-band processing),從而在時頻域同時實現波束形成與噪聲抑制。

背景

[编辑]

在自由手語音通訊 (hands-free communication) 環境中,背景噪聲與混響常導致語音品質下降。 傳統的延遲-加總波束形成 (delay-and-sum beamforming) 雖能抑制非目標方向的聲源,但後續的 Wiener 濾波易造成失真,原因包括:

  • 語音與噪聲功率譜估計不準確;
  • 低頻區噪聲的高空間相干性;
  • 麥克風距離過近導致噪聲相關性上升。

本研究的改進重點是於小波域設計 Wiener 濾波器,並引入基於小波的相干性函數 (wavelet coherence function) 以非線性方式控制噪聲抑制強度。

系統架構

[编辑]

假設輸入信號為: 其中 為乾淨語音, 為加性噪聲。 經由小波變換矩陣 後,信號可表示為: 其中 分別為語音、噪聲與受污染信號在小波域的係數。

處理步驟如下:

  1. 對麥克風訊號進行時間延遲補償;
  2. 使用小波變換分解為多個子頻帶;
  3. 進行波束形成 (beamforming);
  4. 對每個子頻帶執行後濾波;
  5. 合併結果以重建強化語音。

小波域 Wiener 濾波

[编辑]

假設語音與噪聲在小波域中具有對角協方差矩陣,則第 子頻帶的 Wiener 濾波器為: 其輸出估計為: 此濾波器的形式與傅立葉域 Wiener 濾波相同,但透過多解析度分析實現更佳的時頻精度與較低的計算負擔。

小波域相干性濾波

[编辑]

為評估兩信號之間的相關程度,定義小波域相干性函數 (wavelet coherence function)。 假設: 則小波相干性函數定義為:

功率譜採用指數平均更新: 其中 為遺忘因子。

非線性濾波規則

[编辑]

根據觀察,當語音存在時 ,而在靜音時 。 因此設定閾值 以控制濾波強度: 其中

該非線性濾波器能有效去除語音暫停段的背景噪聲。

結合 Wiener 與 Coherence 濾波

[编辑]

為兼顧語音段與靜音段表現,作者提出結合兩者的非線性濾波器: 最終輸出: 此結合法能同時處理相干與非相干噪聲,改善 Wiener 濾波在低頻的效能不足。

實驗與結果

[编辑]
  • 麥克風數量:6
  • 阵列類型:非對稱對數分佈,最小間距
  • 採樣頻率:8 kHz
  • 小波基底:三階 Daubechies 小波 (db3)
  • 評估指標:段式 SNR () 與對數區域比 (Log Area Ratio, LAR)

結果顯示:

  • 在語音暫停段,噪聲消除效果顯著;
  • 聽覺上無不連續感;
  • LAR 顯著下降,表示語音自然度提升。

結論

[编辑]

結合小波域的 Wiener 與相干性濾波能達成高效的多麥克風語音增強:

  • 在靜音段有效抑制雜訊;
  • 在語音段保留細節;
  • 運算複雜度低;
  • 聽覺主觀評估改善顯著。

該演算法為低成本高效能的語音增強系統提供了實用方案。

外部連結

[编辑]