語音增強

維基百科,自由的百科全書

語音增強(Speech enhancement)其目的是藉由使用各種演算法來提高說話語音質量。增強的目的是為改進"了解度(Intelligibility (communication))"及/或"使用音頻信號處理技術提升退化語音信號時"之整體感知質量。

增強因噪聲、或噪聲減少之語音衰減,為語音增強的最重要領域。也應用於許多應用上,諸如流動電話VoIP視訊會議系統、語音識別,以及助聽器等領域。[1]

演算法[編輯]

用於降低噪語增強語音處理的算法可以分為三個基本類別:過濾技術,頻譜恢復,及模式方法。[2]

  • 過濾技術
  • 頻譜差減法。
  • 維納濾波。
  • 信號子空間的法(SSA)。
  • 頻譜恢復
  • 最小均方誤差短時譜幅度估計器(MMSE-STSA)。
  • 基於語音模型

參見[編輯]

註釋[編輯]

  1. ^ J. Benesty, S. Makino, J. Chen (ed). Speech Enhancement. pp.1-8. Springer, 2005. ISBN 978-3-540-24039-6.
  2. ^ J. Benesty, M. M. Sondhi, Y. Huang (ed). Springer Handbook of Speech Processing. pp.843-869. Springer, 2007. ISBN 978-3-540-49125-5.

參考文獻[編輯]

外部連結[編輯]