量化
在数字信号处理领域,量化指将信号的连续取值(或者大量可能的离散取值)近似为有限多个(或较少的)离散值的过程。量化主要应用于从连续信号到数字信号的转换中。连续信号经过采样成为离散信号,离散信号经过量化即成为数字信号。注意离散信号并不需要经过量化的过程。信号的采样和量化通常都是由ADC实现的。
例如CD音频信号就是按照44100Hz的频率采样,按16比特量化为有着65536(=)个可能取值的数字信号。
量化就是将模拟声音的波形转换为数字,表示采样值的二进制位数决定了量化的精度。量化的过程是先将整个幅度划分成有限个小幅度(量化阶距)的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化值。
数学描述
最简单最易懂的量化是标量(有别于多维矢量)量化,开始标量量化之前先要给出输入数据。通常,一个标量量化操作可以给出下面的描述
其中
是实数,
是下取整函数,生成整数
和
是任意的实值函数。
整数是表示的数值,它通常被存储或者传输,然后在后来需要解释的时候使用
进行最终的解释重建。整数
有时也称作量化指数。
在计算机或者其它应用,一个已知的量化方法均匀量化。在均匀量化方法里共有两个变量,叫mid-rise和mid-tread。
如果是一个-1到1之间的数,一个mid-rise uniform量化操作,可以用"M"bit来表示量化的精度。
.
在这个例子中和
运算符都是乘以比例因子(其中一个是另外一个的逆),并且在g(i)中带有一个偏移量以使得每个量化表示都位于输入区域的中间位置。
经常称为量化步长。按照这个量化定律,假定在整个量化步长上量化噪声大致是均匀分布的,并且假定量化的输入信号
在整个-1到1的区间大致均匀分布,量化的信噪比(SNR)可以用下面的公式计算,
.
根据这个等式,人们常说SNR大约是每位6 dB。
在mid-tread一致量化中,偏移0.5将加在下取整函数内部而不是外部。
有时候,mid-rise量化使用时不加偏移0.5。这将信号与噪声比减小了大约6.02 dB,但是当步距小的时候为了简化这是可接受的。
在数字电话系统中,两个流行的量化机制是'A-law'(在欧洲占据主导地位)和'μ-law'(在北美和日本占据主导地位)。这些机制将离散的模拟数值映射到8位尺度,在小值的时候近似线性随着幅度增长按照对数增加。由于人耳对于音量的感知近似对数曲线,这就使用一定的位数在可听见的声音强度范围提供了更高的信噪比。
忽略熵约束:Lloyd–Max量化
在上面的陈述中,若令 等于 0,从而忽略掉比特率约束,或等价地假设要用定长码(FLC)而非用变长码(或其他熵编码法,如算术编码在率失真上就比定长码好)来表示量化数据,这个最优化问题就简化为了只需最小化失真
的问题了。