英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
基于经验模态分解的图像压缩
Anna Linderhed
Swedish Defence Research Agency, Department of IR Systems, Division of Sensor Technology, Linkouml;ping, Sweden Image Coding Group, Department of Electrical Engineering, Linkouml;pings Universitet, Sweden
anna.linderhed@foi.se
摘要:二维经验模态分解(EMD)以其特有的能对局部空间频率进行分离的能力为图像处理提供了一种工具。目前的趋势是,除了第一个固有模态函数(IMFs)外,其余都是低频图像。EMD的可变采样用于图像压缩。利用IMF的非均匀分布极值点来控制块的均匀采样率实现分块的变采样。变采样过程会为每个分块产生采样数。这些可以被压缩成更小的块和用DCT编码。随后,DCT分量进行量化和阈值,使我们使用甚至更少的分量来表示块。本文提出的编码方法是一种新的图像压缩方法,为将来的应用打开了大门。
- 引言
基于EMD的时间频率分析,称为Hilbert-Huang Transform (HHT)[2],是EMD实现的众多应用程序中的一个。使用EMD的时域应用的结论和想法也适用于二维信号,例如图像。EMD将空间频率分量分解为一系列固有模态函数,其中每个空间位置的最高空间频率分量首先是本征模函数,每个空间位置的第二最高空间频率分量为第二阶固有频率函数。一个固有模式函数被定义为一个函数,其中极值点的个数和零交叉数是相同或不同的[2]。在二维情况下,这种要求是宽松的。本征模函数的上、下包络对称于局部均值,用于定义固有模态函数,而非极值点和零交叉数。在两个维度中,有很多定义极值的可能性,每一种都产生不同的分解。在这项工作中,我们简单地通过比较候选数据点和与其最近的8个连接的邻位来提取极值点。显然,存在更精细的方法,因为由8个连接的邻位定义的极值点在这个阶段为EMD提供了目标,进一步的改进是可能的。EMD到二维的扩展依赖于离散极值点的二维样条插值。本文利用薄板平滑样条插值方法[1]对二维EMD进行了简单的处理。该方法给出了一个具有连续二阶导数的曲面,并成功地将一个图像分解为它的多个IMF,以及一个没有或仅有几个极值点的平滑残差[3]。本文首先介绍了第2节中EMD中使用的筛选过程,并对第3节中的变量抽样进行了介绍。在第4节中,这些方法用于图像编码器,第5节中我们给出了结论。
2.筛选二维的IMF
为了找到第一个本征模函数,首先将图像本身作为输入信号。第一个指标是IMF的数字l=1,,,L,第二个指标是筛选过程中迭代次数k=1,...,K,m和n代表两个空间维度。要找到下一个本征模函数,使用与先前获得的IMF相对应的残差作为输入信号。。
寻找信号的本征模函数的筛选过程包括以下步骤:
- 找到所有局部极大值的位置和大小,找到输入信号中所有局部最小值的位置和大小。
- 利用样条插值建立局部最大值上包络和局部极小值下包络的样条插值,分别表示包络和 。
- 对于每个位置,计算上包络和下包络的平均值。
(1)
信号被称为包络平均值。
- 从输入信号中减去包络平均信号。
图1 128x128像素大小的Lenna图像
(2)
这是筛选过程的一次迭代。下一步是检查步骤4中的信号是否为IMF。当包络线平均信号接近于(5)所提出的零时,该过程停止。
(3)
的停止准则的标准以这种方式影响EMD,如果它不是足够小,不会有足够数量的IMF分量分离信号中的所有固有模式的EMD,另一方面,如果数量太小则迭代需要长时间。
强制使包络均值为零将使我们得到所需的包络对称性和零交叉数和定义固有模态函数的极值数之间的正确关系。这样我们就可以找到固有模式函数而不必检查对称的包络了。
- 根据停止标准,检查平均信号是否接近于零。如果不是,从第1步开始,将第4步所产生的信号作为输入信号,重复多次。
当停止标准符合IMF时,定义(4)为最后结果。
(4)
找到IMF后,将残差定义为
(5)
- 下一个IMF是从步骤1开始的,现在以残差作为输入信号。
(6)
步骤(1)至(6)可以为所有后续的重复。EMD是完成时的残留,理想的情况下,不包含任何的极值点。信号可以表示为IMF和残基的总和
(7)
图1所示的Lenna图像是用上面描述的EMD方法分解的。图像的四个IMF及其相应的残差如图2所示。最后残留的只有极少数的极值点。
a b e f
c d g h
图2 a)第一个IMF,b)第一个残差,c)第二个IMF,d)第二个残差,e)第三个IMF,f)第三个残差,g)第四个IMF,h)第四个残差
3.多抽样重叠块
EMD是一种真正的经验方法,不是基于傅里叶变换法,而是与极值点和零交叉的位置有关。基于这一点,我们使用了有效性的概念[4],即经验模式频率的缩写,而不是传统的基于傅里叶变换的频率测量方法来描述信号的振荡。对于EMD的变量采样,采用了经验值变化的固有模式函数的特殊性质。有许多极值点的区域具有较高的经验值,而只有少数点或没有端点的区域具有较低的经验值。IMFs比图像本身更平滑,只有第一个固有模式函数包含图像的非光滑部分。这意味着可以对固有模式函数进行子采样。由于在固有模态函数的不同部分中存在不同的经验值,所以在固有模态函数的不同部分,子抽样可以有所不同。重要的(相对于定义零区)极值点定义的固有模态函数的最大经验值[3]。最大的经验是通过检查重要的极值点之间的空间来发现的。正如[4]中所建议的那样,我们对IMF进行了封锁。这样,每个块的采样率可以根据它的经验内容来定义。不能进行子采样的高权限块没有被修改。其余的都是次采样。
在实现阻塞过程中,我们选择使用大小为7x7像素的重叠块,详细过程可以在[3]中找到。重叠的目的是为了最小化来自阻塞的伪像,并进一步减少用于表示固有模式函数的样本数量。选择块的大小,以使块的各个角始终表示,而不考虑所选的采样率。块内的采样模式由每个像素、每一个第二像素、每第三个像素和每两个方向的每第六个像素组成,分别代表像素的1/1、1/4、1/9和1/36。两个相邻块中的重叠像素将是相同的,会使用几次,这将确保连接的块在边缘像素处具有相同的值。对于重构,该块的均匀采样点通过使用插值三次样条扩展到二维空间来连接。
图3 详细信息二的VSDCTEMD编码结果,零区= 1、10、20,量化从256级降至8级
图4 详细信息一的VSDCTEMD编码结果, 零区= 1、10、20,量化从256级降至8级。
- 用多抽样块和DCT对EMD进行编码(VSDCTEMD)
该图像编码器使用EMD的基本概念来分解图像,并将多抽样和DCT编码器应用于IMF和残差。在[6]中使用了类似的方法,但使用了一个小波编码器而不是一个DCT编码器。每个固有模态函数被划分为重叠块。块的最大经验值决定了块的次采样的采样率。样本仅用一个样本或6x6、3x3或2x2块样本表示。这些是DCT编码的,并且在添加两位块标题之前,量化组件并对其进行阈值处理,得到的分量流是霍夫曼编码或固定长度编码的。
重构是通过读取两个位标头来完成的,它表示所使用的采样率。利用这些信息,从反DCT变换形式的过程中获得的组件可以放置在7x7像素块中的适当位置。该过程只包含6x6块的样本,缺失的样本在重构的相邻块中找到。由于缺失的样本位于块的最右边一列和最下一行,因此重构将从右下角的块开始逐行处理块。对于没有邻位的块保留缺失样本,使用虚拟样本。 内插7times;7个采样块,并且重构块的非重叠6times;6部分用于生成输出IMF。然后通过添加重构的IMF和重构的最后一个残差组合图像。
我们发现[3][5][6]第一个IMF几乎与图像本身一样难以压缩,而其余的IMF和所有的残基都是平滑的,并且只能用一小部分全尺寸的DCT。在这里介绍的编码器的修改版本中,我们只将图像分解成一个IMF和一个残差。我们在第一个IMF上使用VSDCTEMD,在残差上使用全尺寸DCT的阈值编码。
a b c d
图5 VSDCTEMD a)原图1, b)使用4.79 bpp重构为28.27 dB,
c)原图2, d)使用3.56 bpp重构为30.76 dB。
- (b)
图6.将第一层IMF中的VSDCTEMD编码与残差中的DCT阈值编码相结合的结果,
a)细节一,b)细节二
- 结果
VSDCTEMD编码器在两个不同的图像上测试,使用零域1,10和20。量化从256级降至8级。对DCT分量进行阈值处理,只留下那些值大于或等于阈值的分量。阈值从最大值的0.1%到100%变化。 图3和图4分别显示了测试图像的EMD的编码结果。编码方法为所有IMF和残差提供了良好的结果。 即使对于不平滑的第一个IMF,对于1bpp的比特率,其结果也超过30dB。在图5中,呈现出重构图像与原始图像。
虽然每个IMF的编码结果和残差都是令人满意的,但通过添加重构IMF和重构残差的图像的比特率大幅增加。使用4.79 bpp将一幅图像重构为28.27 dB,使用3.56 bpp将两幅图像重构为30.76 dB。
图6显示了对第一个残差使用VSDCTEMD和DCT阈值编码的第一个IMF编码的结果。图7中给出了每个图像的两个不同重构示例。第一幅图使用1.00 bpp重构为30.09 dB,使用0.79 bpp重构为29.23 dB,第二幅图使用1.28 bpp重构为30.02 dB,使用0.69 bpp重构为28.88 dB。
a b c d
图7.第一层IMF中的VSDCTEMD编码结果和残差中的DCT阈值编码
a)使用1.00 bpp重构为30.09 dB,b)使用0.79 bpp 重构为29.23 dB
c)使用1.28 bpp 重构为30.02 dB,d)使用0.69 bpp 重构为28.88 dB
- 总结
EMD在二维方面为图像处理提供了一种工具。我们展示了如何将图像分解为一组IMF和具有最小极值点的残差。得到的趋势信息是除了第一个以外的IMF,其余都是低频图像。这可以用于整个图像的DCT编码。EMD的变量采样已经用于图像压缩,按照块的方式,使用IMF的非均匀位置极值点来控制块的均匀采样率。量化每个块的可变采样的DCT分量并对其进行阈值处理,从而使我们的采样块更少。整个VSDCTEMD的结果并不令人满意,所以我们增加了许多IMF,而仅对第一个IMF使用VSDCTEMD,对第一个残差使用阈值编码的全尺寸DCT,我们得到了更好的结果。这些结果与[6]中的结果具有相同的质量。
- 参考文献
[1] F. L. Booksstein, “Principal warps: Thin-plate splines and the Decomposition of deformations”, IEEE Trans. on Pattern analysis and machine intelligence, vol 11, no 6, june 1989.
[2]N. E. Huang et al. ”The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis”, Proc. R. Soc. Lond. A , 1998.
[3]A. Linderhed, “Adaptive Image Compression with Wavelet Packets and Empirical Mode Decomposition”, PhD thesis, Linkouml;ping Univ
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[23854],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。