自适应多速率音频压缩

维基百科,自由的百科全书
跳转至: 导航搜索
窄带自适应多速率(AMR-NB)
扩展名 .amr
互联网媒体类型 音频/amr
格式 音频

自适应多速率音频压缩Adaptive multi-Rate compression,简称AMR)是一个使语音编码最优化的专利。AMR被标准语音编码 3GPP在1998年10月选用,现在广泛在GSMUMTS中使用。它使用1-8个不同的位速编码.

AMR 也是一个文件格式,存储AMR 语音编码文件. 很多手机允许你存储短时间的AMR 格式录音,在开源(参看外部链接)和商业软件有和其他格式转换的程序例如 MP3,但是要记住AMR是一个语音格式,但并不是理想的记录其他声音的方式。普通文件扩展名.amr

使用[编辑]

为保证每20毫秒160采样点的采样率,AMR使用ACELP、DTX、VAD和CNG等不同的技术,从中选择最好的编码模式适应局部信道和通路频带要求。如果广播条件差,源编码减少,信道编码增加。提高网络连接的品質,但要牺牲语音的清晰度。在特别情况下AMR 增加大约S/N = 4-6 dB。

共计14种方式AMR编码,8个全频(FR)和6个半频(HR)。

Mode Bitrate (kbit/s) Channel 兼容
AMR_12.20 12.20 FR ETSI GSM enhanced full rate
AMR_10.20 10.20 FR
AMR_7.95 7.95 FR/HR
AMR_7.40 7.40 FR/HR TIA/EIA IS-641 TDMA enhanced full rate
AMR_6.70 6.70 FR/HR ARIB 6.7 kbit/s enhanced full rate
AMR_5.90 5.90 FR/HR
AMR_5.15 5.15 FR/HR
AMR_4.75 4.75 FR/HR
AMR_SID 1.80 FR/HR

特点[编辑]

  • 采样率 8 kHz/13-bit (160 采样点每20ms),滤波后只保留 200-3400 Hz 范围内的信号.
  • 编码器使用8个位速:12.2、10.2、7.95、7.40、6.70、5.90、5.15和4.75 kbit/s.
  • 生成的帧长度为95、103、118、134、148、159、204或244比特,对应的位速分别为4.75、5.15、5.90、6.70、7.40、7.95、10.2或12.2 kbit/s.
  • AMR利用 Discontinuous Transmission (DTX), Voice Activity Detection (VAD)和Comfort Noise Generation (CNG)减少在无声时候的带宽
  • 算法延迟是每帧20ms。位速是12.2的时候,没有前瞻延迟。其他速率的前瞻延迟是5 ms. 注有5 ms 的仿前瞻延迟,允许准确的帧宽模式转换其余速率。
  • AMR是使用 Algebraic Code Excited Linear Prediction (ACELP)的混合语言编码器。
  • 运算法则的复杂性是5的话,则 G.711 是1 G.729a 是15。
  • PSQM在理想条件下测试失真Mean Opinion Scores AMR(12.2 kbit/s)是 4.14,相比G.711 (u-law) 是 4.45。
  • PSQM在网络条件下Mean Opinion Scores AMR(12.2 kbit/s)是3.79,相比G.711 (u-law) 是4.13。

专利许可[编辑]

AMR编解码器数个专利:

参看[编辑]

外部链接[编辑]