倒频谱(cepstrum),顾名思义,就是将频谱(spectrum)的英文前四个字母反过来写。倒频谱是为了某些时候,为了计算方便,将原来信号的频谱先转成类似分贝的单位,再作逆傅里叶变换,把它视为一种新的信号做处理。倒频谱有复数倒频谱,及实数倒频谱。
倒频谱被定义在1963的论文(Bogert等)。定义如下:
- 字义:倒频谱(信号)是信号频谱取对数的傅里叶变换后的新频谱(信号),有时候会称频谱的倒频谱。
- 数学上:信号的倒频谱 = IFT ( log ( | FT (信号) | ) + j2πm )(m为实数)
- 算法:信号 -> 傅立叶变换 -> 取绝对值 -> 取对数 -> 相位展开 -> 逆傅立叶变换 -> 倒频谱
复数倒频谱拥有频谱大小跟相位的信息,实数倒频谱只有频谱大小的信息,各有各的不同应用。
复数倒频谱与实数倒频谱[编辑]
复数倒频谱[编辑]
![{\displaystyle {\widehat {x}}\left[n\right]=\int _{-{\frac {1}{2}}}^{\frac {1}{2}}{\widehat {X}}\left(F\right)e^{j{2\pi }F}dF}](https://wikimedia.org/api/rest_v1/media/math/render/svg/53fd79fd08cb7baa43c180daf38b077280c97a78)
其中![{\displaystyle {\widehat {X}}\left[F\right]=\log |X(F)|+j\arg[X(F)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1b19f21fc1c295029e394a3ae81e0ae6dc5a4d1b)
可能遭遇的问题
1. 
2.
有无限多的解
当输入是实数时,因为
偶对称,
奇对称,所以复数倒频谱的值为实数
实数倒频谱[编辑]
![{\displaystyle C\left[n\right]=\int _{-{\frac {1}{2}}}^{\frac {1}{2}}\log |X(F)|e^{j{2\pi }Fn}dF}](https://wikimedia.org/api/rest_v1/media/math/render/svg/34cd5d49bf4f60bb7a029bf52243b16355db9a34)
可能遭遇的问题
1. 
- 倒频谱可以被视为在不同频带上变化速率的信息,倒频谱一开始被发明在地震或炸弹产生的地震回音,现今也被使用在分析雷达信号,以及信号处理等问题。
- 自相关倒频谱(autocepstrum)被定义为倒频谱的自相关性,自相关倒频谱有时在分析处理回传信号时比倒频谱还准确。
- 倒频谱在处理人声信号以及音乐信号有非常好的效果,例如梅尔频率倒频谱(Mel-Frequency Cepstrum),用来做声音的辨认,侦测音高等。近年来梅耳倒频谱也被应用在音乐信息的回复。
- 倒频谱在声学中可以将声带震动的影响去除。
- 倒频谱用在处理多路径问题时(如声波的回音、电磁波的折、反射等),如果将其他路径干扰视为噪声,为了消除噪声,利用倒频谱,不需测量每条多路径的延迟时间,可以利用传送多次信号,观察其他路径在倒频谱上的效果,并且加以滤除。
- 语音大致上是由音高、声带脉冲、声门波形所组成,我们可以利用倒频谱将这三种元素在倒频域上分开,以利于做语音信号的分析。
- 倒频谱的微分适用于影像处理上的图形辨认(pattern recognition)。
- 倒频谱与同型声音理论(homomorphic sound theory)有关。
倒频谱观念[编辑]
频谱图上的独立变数是频率,而倒频谱图上的独立变数为倒频率(quefrency),倒频率是一种时间的度量单位。举个例子,声音信号采样速率等于44100赫兹,在倒频谱上有个很大的值在倒频率等于100,代表实际上在44100/100=441赫兹有很大的值,这值出现在倒频谱上因为频谱上周期性出现,而频谱上出现的周期与倒频谱很大的值出现的位置有关。
倒滤波器[编辑]
滤波器(filter)常使用在频谱上,用来保存或删除我们所要或不要的信息,经过上面的许多讨论,不难猜到,倒滤波器(lifter)就是在倒频谱上所使用的滤波器。低通的倒滤波器跟低通滤波器有点类似,它可以借由在倒频谱上乘以一个window系数,使倒频谱上的高倒频率被压抑,如此依来,当信号转回时域空间时会变成一个较平滑的信号。
计算倒频谱的方法[编辑]
直接计算IDTFT(反离散时间傅里叶变换)[编辑]
![{\displaystyle {\widehat {x}}\left[n\right]=\int _{-{\frac {1}{2}}}^{\frac {1}{2}}{\widehat {X}}\left(F\right)e^{j{2\pi }F}dF}](https://wikimedia.org/api/rest_v1/media/math/render/svg/53fd79fd08cb7baa43c180daf38b077280c97a78)
问题:
可能会无限大, 且对于arg(x[n])有无限多个解
利用Z变换的零点与极点[编辑]
先对信号做Z变换, 并整理一下系数, 让他变成下面的形式

其中
分子:
第一项A是系数
第二项
是延迟
第三项是位于单位圆内的零点
第四项是位于单位圆外的零点
分母:
第一项是位于单位圆内的极点
第二项是位于单位圆外的极点
对
取log变成

假设r=0, 因为这只是延迟, 并不会破坏波形
根据Z变换所得到的系数, 我们可以利用泰勒展开得到Z的逆变换
![{\displaystyle {\widehat {x}}\left[n\right]={\begin{cases}\log A&{\mbox{if }}n=0\\-\sum _{k=1}^{m_{i}}{\cfrac {{a_{k}}^{n}}{n}}+\sum _{k=1}^{P_{i}}{\cfrac {{c_{k}}^{n}}{n}}&{\mbox{if }}n>0\\\sum _{k=1}^{m_{0}}{\cfrac {{b_{k}}^{-n}}{n}}-\sum _{k=1}^{P_{0}}{\cfrac {{d_{k}}^{-n}}{n}}&{\mbox{if }}n<0\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/19942017ae2cdf8b619f798bc865e1f17676dc49)
注意事项
1.
总是IIR(无限冲激响应)
2.对于FIR(有限冲激响应)的情况,
利用Z变换与微分[编辑]


对其做Z的逆变换
![{\displaystyle nx[n]=\sum _{k=-\infty }^{\infty }k{\widehat {x}}\left[k\right]x[n-k]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6053e45be601a109313ea254e6b277b57462b82a)
故
![{\displaystyle x[n]=\sum _{k=-\infty }^{\infty }{\frac {k}{n}}{\widehat {x}}\left[k\right]x[n-k]\quad for\ n\neq 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/386f0809c5dcf9db9063c484700063ab375aa886)
分别对于x[n]的四种不同的状况做延伸
1.对于x[n]是因果(causal)和最小相位(minimum phase) i.e. ![{\displaystyle x[n]={\widehat {x}}\left[n\right]=0,n<0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1514630ccb026c54daad133a2d74bb842e37ff1a)
对于![{\displaystyle x[n]=\sum _{k=-\infty }^{\infty }{\frac {k}{n}}{\widehat {x}}\left[k\right]x[n-k]\quad for\ n\neq 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/386f0809c5dcf9db9063c484700063ab375aa886)
可得出
![{\displaystyle x[n]=\sum _{k=0}^{\infty }{\frac {k}{n}}{\widehat {x}}\left[k\right]x[n-k]\quad for\ n>0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3b4951bd7acfad55c12edc885966d193f70f57d6)
故
![{\displaystyle x[n]={\widehat {x}}\left[n\right]x[0]+\sum _{k=0}^{n-1}{\frac {k}{n}}{\widehat {x}}\left[k\right]x[n-k]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7edc8cf408a7d7ad9140920a64c1844b161d3ed9)
2.对于x[n]是最小相位(minimum phase)
![{\displaystyle {\widehat {x}}\left[n\right]={\begin{cases}0&{\mbox{if }}n<0\\{\cfrac {x[n]}{x[0]}}-\sum _{k=0}^{n-1}{\cfrac {k}{n}}{\widehat {x}}\left[k\right]{\cfrac {x[n-k]}{x[0]}}&{\mbox{if }}n>0\\\log A&{\mbox{if }}n=0\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ed67360fdb129413613e9166fecd8b6501f4e738)
3.对于x[n]是反因果(anti-causal)且最大相位(maximum phase) i.e. ![{\displaystyle x[n]={\widehat {x}}\left[n\right]=0,n>0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/81495c66d4414a7c87ca5a67565810ec87979661)
![{\displaystyle {\begin{aligned}x[n]&=\sum _{k=n}^{0}{\cfrac {k}{n}}{\widehat {x}}\left[k\right]x[n-k]\quad for\ n<0\\&={\widehat {x}}\left[n\right]x[0]+\sum _{k=n+1}^{0}{\cfrac {k}{n}}{\widehat {x}}\left[k\right]x[n-k]\\\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c90ffd6365339c19df9be6406e90b8af6ae5e890)
4.对于x[n]是最大相位(maximum phase)
![{\displaystyle {\widehat {x}}\left[n\right]={\begin{cases}0&{\mbox{if }}n>0\\{\cfrac {x[n]}{x[0]}}-\sum _{k=n+1}^{0}{\cfrac {k}{n}}{\widehat {x}}\left[k\right]{\cfrac {x[n-k]}{x[0]}}&{\mbox{if }}n<0\\\log A&{\mbox{if }}n=0\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f740b6047d4c0205a92e5114685a9807c2b3527c)
1. 复数倒频谱至少以
的速度衰退
![{\displaystyle |{\widehat {x}}\left[n\right]|=c|{\frac {{\alpha }^{n}}{n}}|\quad -\infty <n<\infty }](https://wikimedia.org/api/rest_v1/media/math/render/svg/e336e1c3ee0bbb56cd37840d6eb070f51b230316)
其中 
2. 如果X(Z)没有在单位圆以外的零点和极点, 则
![{\displaystyle {\widehat {x}}\left[n\right]=0\quad for\ all\ n<0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1be4cfda70976ead8352817f095e5687a6b19bb1)
因为
3. 如果X(Z)没有在单位圆以内的零点和极点, 则
![{\displaystyle {\widehat {x}}\left[n\right]=0\quad for\ all\ n>0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/92a992c190980f58cb79553e4bf42fb5f6e38f20)
因为
4. 如果x[n]是有限长度, 则
是无限长度
梅尔频率倒频谱[编辑]
梅尔频率倒频谱是倒频谱的一种应用,梅尔频率倒频谱常应用在声音信号处理,对于声音信号处理比倒频谱更接近人耳对声音的分析特性,而梅尔频率倒频谱与倒频谱的差别在于:
- 梅尔频率倒频谱的频带分析是根据人耳听觉特性所设计,人耳对于频率的分辨能力,是由频率的"比值"决定,也就是说,人耳对200赫兹和300赫兹之间的差别与2000赫兹和3000赫兹之间的差别是相同的。
- 梅尔频率倒频谱是针对信号的能量取对数,而倒频谱是针对信号原始在频谱上的值取对数。
- 梅尔频率倒频谱是使用离散余弦变换,倒频谱是用离散傅里叶变换。
- 梅尔频率倒频谱系数足够描述语音的特征。
梅尔频率倒频谱系数(MFCCs)的推导步骤:
- 将信号做傅里叶变换
- 频谱上的值取绝对值再平方成为能量,在乘上频谱上对应的梅尔频率倒频谱三角重叠窗(window)的系数。
- 对每个梅尔频率取对数。
- 作离散余弦变换。
- 求得梅尔频率倒频谱系数。
梅尔频率倒频谱应用[编辑]
- 梅尔频率倒频谱系数常利用在辨认语音技术上,例如辨认电话中说话的人的身份。
- 利用每种乐风、或乐器在梅尔频域上有不同特性来分析音乐的种类与类型,并且可以加以分类。
噪声敏感性[编辑]
梅尔频率倒频谱系数很容易被外来的噪声所破坏,因此有些研究结果指出,在求梅尔频率倒频谱系数时,在作离散余弦变换前,提升适当的能量(大约2或3倍),以减少噪声在低能量成分的影响。
梅尔频率倒频谱优点[编辑]
相较于原始的倒频谱
倒频谱领域上的一项重要的特性为二信号卷积之产生,其产生之程序为二倒频谱值(cepstra)之相加:
微分倒频谱(differential cepstrum)[编辑]
或 ![{\displaystyle {\widehat {x}}_{d}[n]=\int _{-{\frac {1}{2}}}^{\frac {1}{2}}{\frac {X'(F)}{X(F)}}e^{i2\pi F}dF}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7a442cde66a5681fcaec1cf5326223e0d9cedeaa)

If 




优点:
(a)没有模糊的相位
(b)可以处理延迟问题
(1)微分倒频谱在shift和scaling时,结果不改变。
ex: ![{\displaystyle y[n]=AX[n-r]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f4224b81109de9905f7a132a4dfeecada6de33f9)

(proof):



(2)复数倒频谱
与 微分倒频谱
和原信号x[n]有关
diff cepstrum
recursive formula
复数频谱做得到的事情, 微分倒频谱也做得到
(3)如果x[n]是最小相位(minimum phase),则
,当
minimum phase 意思为 no poles 或 zeros 在单位圆外
(4)如果x[n]是最大相位(maximum phase),则
,当
maximum phase 意思为 no poles 或 zeros 在单位圆内
(5)如果x(n)为有限区间,则
为无限区间
- 复数倒频谱的衰减率反比于n
- 微分倒频谱的衰减率下降

,otherwise 0 , Find its cepstrum.
![{\displaystyle x[n]\quad {\stackrel {Ztransform}{\longrightarrow }}\quad X(Z)\quad {\stackrel {log}{\longrightarrow }}\quad {\widehat {X}}(Z)\quad {\stackrel {Z^{-1}}{\longrightarrow }}\quad {\widehat {x}}[n]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c59b1842420ee6a92a756488936bf3ffb0bb6a1f)
step 1. Z transform: 
step 2. log: 
step 3. reverse Z transform:
,otherwise 0 , Find its inverse cepstrum.
![{\displaystyle {\widehat {x}}[n]\quad {\stackrel {Ztransform}{\longrightarrow }}\quad {\widehat {X}}(Z)\quad {\stackrel {exp}{\longrightarrow }}\quad {X}(Z)\quad {\stackrel {Z^{-1}}{\longrightarrow }}\quad {x}[n]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cfd7884d2ca6a4eb0b92e9f16424f89ba72b89f6)
step 1. Z transform: ![{\displaystyle {\widehat {X}}[n]=Z^{-1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8b5395f3c192a651dbf39001117394100db2c77c)
step 2. exp: 
step 3. reverse Z transform: ![{\displaystyle x[n]={\begin{cases}{\frac {1}{n!}},n\geq 0\\0,otherwise\\\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c8a7cbd7fa5f686ebb4a438db8ba718475f40a75)
- Suppose that an IIR filter is

![{\displaystyle x[n]\quad {\stackrel {Ztransform}{\longrightarrow }}\quad X(Z)\quad {\stackrel {log}{\longrightarrow }}\quad {\widehat {X}}(Z)\quad {\stackrel {Z^{-1}}{\longrightarrow }}\quad {\widehat {x}}[n]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c59b1842420ee6a92a756488936bf3ffb0bb6a1f)
step 1. Z transform: 
step 2. log: 
step 3. reverse Z transform: ![{\displaystyle {\widehat {h}}[n]={\begin{cases}log(-2),n=0\\\displaystyle {-{\frac {{({\frac {\sqrt {2}}{2}})}^{n}+{({\frac {-{\sqrt {2}}}{2}})}^{n}}{n}}+{\frac {{({\frac {1+j}{2}})}^{n}+{({\frac {1-j}{2}})}^{n}}{n}},n>0}\\\displaystyle {\frac {{({\frac {1}{2}})}^{-n}}{n}},n<0\\\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0fa5cdfbbcaef6760dfc4bedb97292af6f1c86d7)

参考文献[编辑]
- B. P. Bogert, M. J. R. Healy, and J. W. Tukey: "The quefrency analysis of time series for echoes: cepstrum, pseudo-autocovariance, cross-cepstrum, and saphe cracking". Proceedings of the Symposium on Time Series Analysis (M. Rosenblatt, Ed) Chapter 15, 209-243. New York: Wiley, 1963.
- D. G. Childers, D. P. Skinner, R. C. Kemerait, "The Cepstrum: A Guide to Processing(页面存档备份,存于互联网档案馆)," Proceedings of the IEEE, Vol. 65, No. 10, October 1977, pp. 1428-1443.
- Jian-Jiun Ding, Advanced Digital Signal Processing class note,the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2008