摘 要:数字图像压缩技术对于数字图像信息在网络上实现快速传输和实时处理具有重要的意义。本文介绍了当前几种最为重要的图像压缩算法:jpeg、jpeg2000、分形图像压缩和小波变换图像压缩,总结了它们的优缺点及发展前景。然后简介了任意形状可视对象编码算法的研究现状,并指出此算法是一种产生高压缩比的图像压缩算法。
关键词:数字图像;图像压缩;压缩技术;任意形状可视对象编码
abstract: digital image compression technology is of special intrest for the fast transmission and real-time processsing of digital image information on the internet. the paper introduces several kinds of the most important image compression algorithms at present: jpeg, jpeg2000, fractal image compression and wavelet transformation image compression, and summarizes their advantage and disadvantage and development prospect. then it introduces simply the present development of coding algorithms about arbitrary shape video object, and indicates the algorithms have a high compression rate.
key word: digital image; image compression; compress technique; arbitrary shape visible object code
一、引 言
随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。
图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50多年的历史了[1]。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。
二、jpeg压缩
负责开发静止图像压缩标准的“联合图片专家组”(joint photographic expert group,简称jpeg),于1989年1月形成了基于自适应dct的jpeg技术规范的第一个草案,其后多次修改,至1991年形成iso10918国际标准草案,并在一年后成为国际标准,简称jpeg标准。
1.jpeg压缩原理及特点
jpeg算法中首先对图像进行分块处理,一般分成互不重叠的 大小的块,再对每一块进行二维离散余弦变换(dct)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后进行哈夫曼编码。jpeg的特点如下:
优点:(1)形成了国际标准;(2)具有中端和高端比特率上的良好图像质量。
缺点:(1)由于对图像进行分块,在高压缩比时产生严重的方块效应;(2)系数进行量化,是有损压缩;(3)压缩比不高,小于50[2]。
jpeg压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用gauss过程来刻画,并且图像中的一些突变结构例如边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其结果不是最优的[3]。
2. jpeg压缩的研究状况及其前景[2]
针对jpeg在高压缩比情况下,产生方块效应,解压图像较差,近年来提出了不少改进方法,最有效的是下面的两种方法:
(1)dct零树编码
dct零树编码把 dct块中的系数组成log2n个子带,然后用零树编码方案进行编码。在相同压缩比的情况下,其psnr的值比 ezw高。但在高压缩比的情况下,方块效应仍是dct零树编码的致命弱点。
(2)层式dct零树编码
此算法对图像作 的dct变换,将低频 块集中起来,做 反dct变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式dct变换及零树排列过的系数进行零树编码。
jpeg压缩的一个最大问题就是在高压缩比时产生严重的方块效应,因此在今后的研究中,应重点解决 dct变换产生的方块效应,同时考虑与人眼视觉特性相结合进行压缩。
三、jepg2000压缩
jpeg2000是由iso/iec jtcisc29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式—jpeg2000图像压缩标准的编码算法。
1.jpeg2000压缩原理及特点
jpeg2000编解码系统的编码器和解码器的框图如图1所示[4]。
编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(dc)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。
jpeg2000格式的图像压缩比,可在现在的jpeg基础上再提高10%~30%,而且压缩后的图像显得更加细腻平滑。对于目前的jpeg标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在jpeg2000系统中,通过选择参数,能够对图像进行有损和无损压缩。现在网络上的jpeg图像下载时是按“块”传输的,而jpeg2000格式的图像支持渐进传输,这使用户不必接收整个图像的压缩码流。由于jpeg2000采用小波技术,可随机获取某些感兴趣的图像区域(roi)的压缩码流,对压缩的图像数据进行传输、滤波等操作[4]。
图1 jpeg2000压缩编码与解压缩的总体流程
2.jpeg2000压缩的前景
jpeg2000标准适用于各种图像的压缩编码。其应用领域将包括internet、传真、打印、遥感、移动通信、医疗、数字图书馆和电子商务等[5]。jpeg2000图像压缩标准将成为21世纪的主流静态图像压缩标准。
四、小波变换图像压缩
1.小波变换图像压缩原理
小波变换用于图像编码的基本思想就是把图像根据mallat塔式快速小波变换算法进行多分辨率分解。其具体过程为:首先对图像进行多级小波分解,然后对每层的小波系数进行量化,再对量化后的系数进行编码。小波图像压缩是当前图像压缩的热点之一,已经形成了基于小波变换的国际压缩标准,如mpeg-4标准,及如上所述的jpeg2000标准 [2]。
2.小波变换图像压缩的发展现状及前景
目前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码(ezw),分层树中分配样本图像编码(spiht)和可扩展图像压缩编码(ebcot)。
(1)ezw编码器[6]
1993年,shapiro引入了小波“零树”的概念,通过定义pos、neg、iz和ztr四种符号进行空间小波树递归编码,有效地剔除了对高频系数的编码,极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式,算法复杂度低。ezw算法打破了信息处理领域长期笃信的准则:高效的压缩编码器必须通过高复杂度的算法才能获得,因此ezw编码器在数据压缩史上具有里程碑意义。
(2)ebcot编码器[8]
优化截断点的嵌入块编码方法(ebcot)首先将小波分解的每个子带分成一个个相对独立的码块,然后使用优化的分层截断算法对这些码块进行编码,产生压缩码流,结果图像的压缩码流不仅具有snr可扩展而且具有分辨率可扩展,还可以支持图像的随机存储。比较而言,ebcot算法的复杂度较ezw和spiht有所提高,其压缩性能比spiht略有提高。
小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中在对小波系数的编码问题上。在以后的工作中,应充分考虑人眼视觉特性,进一步提高压缩比,改善图像质量。并且考虑将小波变换与其他压缩方法相结合。例如与分形图像压缩相结合是当前的一个研究热点[2]。
(3)spiht编码器[7]
由said和pearlman提出的分层小波树集合分割算法(spiht)则利用空间树分层分割方法,有效地减小了比特面上编码符号集的规模。同ezw相比,spiht算法构造了两种不同类型的空间零树,更好地利用了小波系数的幅值衰减规律。同ezw编码器一样,spiht编码器的算法复杂度低,产生的也是嵌入式比特流,但编码器的性能较ezw有很大的提高。
五、分形图像压缩
1988年,barnsley通过实验证明分形图像压缩可以得到比经典图像编码技术高几个数量级的压缩比。1990年,barnsley的学生a.e.jacquin提出局部迭代函数系统理论后,使分形用于图像压缩在计算机上自动实现成为可能。
1. 分形图像压缩的原理
分形压缩主要利用自相似的特点,通过迭代函数系统(iterated function system, ifs)实现。其理论基础是迭代函数系统定理和拼贴定理。
分形图像压缩把原始图像分割成若干个子图像,然后每一个子图像对应一个迭代函数,子图像以迭代函数存储,迭代函数越简单,压缩比也就越大。同样解码时只要调出每一个子图像对应的迭代函数反复迭代,就可以恢复出原来的子图像,从而得到原始图像[9]。
2.几种主要分形图像编码技术[9]
随着分形图像压缩技术的发展,越来越多的算法被提出,基于分形的不同特征,可以分成以下几种主要的分形图像编码方法。
(1)尺码编码方法
尺码编码方法是基于分形几何中利用小尺度度量不规则曲线长度的方法,类似于传统的亚取样和内插方法,其主要不同之处在于尺度编码方法中引入了分形的思想,尺度 随着图像各个组成部分复杂性的不同而改变。
(2)迭代函数系统方法
迭代函数系统方法是目前研究最多、应用最广泛的一种分形压缩技术,它是一种人机交互的拼贴技术,它基于自然界图像中普遍存在的整体和局部自相关的特点,寻找这种自相关映射关系的表达式,即仿射变换,并通过存储比原图像数据量小的仿射系数,来达到压缩的目的。如果寻得的仿射变换简单而有效,那么迭代函数系统就可以达到极高的压缩比。
(3)a-e-jacquin的分形方案
a-e-jacquin的分形方案是一种全自动的基于块的分形图像压缩方案,它也是一个寻找映射关系的过程,但寻找的对象域是将图像分割成块之后的局部与局部的关系。在此方案中还有一部分冗余度可以去除,而且其解码图像中存在着明显的方块效应。
3.分形图像压缩的前景[2]
虽然分形图像压缩在图像压缩领域还不占主导地位,但是分形图像压缩既考虑局部与局部,又考虑局部与整体的相关性,适合于自相似或自仿射的图像压缩,而自然界中存在大量的自相似或自仿射的几何形状,因此它的适用范围很广。
六、其它压缩算法
除了以上几种常用的图像压缩方法以外,还有:nnt(数论变换)压缩、基于神经网络的压缩方法、hibert扫描图像压缩方法、自适应多相子带压缩方法等,在此不作赘述。下面简单介绍近年来任意形状纹理编码的几种算法[10]~ [13]。
(1)形状自适应dct(sa-dct)算法
sa-dct把一个任意形状可视对象分成 的图像块,对每块进行dct变换,它实现了一个类似于形状自适应gilge dct[10][11]变换的有效变换,但它比gilge dct变换的复杂度要低。可是,sa-dct也有缺点,它把像素推到与矩形边框的一个侧边相平齐,因此一些空域相关性可能丢失,这样再进行列dct变换,就有较大的失真了[11][14][15]。
(2)形状自适应离散小波变换(sa-dwt)
li等人提出了一种新颖的任意形状对象编码,sa-dwt编码[18]~[22]。这项技术包括sa-dwt和零树熵编码的扩展(zte),以及嵌入式小波编码(ezw)。sa-dwt的特点是:经过sa-dwt之后的系数个数,同原任意形状可视对象的像素个数相同;小波变换的空域相关性、区域属性以及子带之间的自相似性,在sa-dwt中都能很好表现出来;对于矩形区域,sa-dwt与传统的小波变换一样。sa-dwt编码技术的实现已经被新的多媒体编码标准mpeg-4的对于任意形状静态纹理的编码所采用。
在今后的工作中,可以充分地利用人类视觉系统对图像边缘部分较敏感的特性,尝试将图像中感兴趣的对象分割出来,对其边缘部分、内部纹理部分和对象之外的背景部分按不同的压缩比进行压缩,这样可以使压缩图像达到更大的压缩比,更加便于传输。
(3)egger方法
egger等人[16][17]提出了一个应用于任意形状对象的小波变换方案。在此方案中,首先将可视对象的行像素推到与边界框的右边界相平齐的位置,然后对每行的有用像素进行小波变换,接下来再进行另一方向的小波变换。此方案,充分利用了小波变换的局域特性。然而这一方案也有它的问题,例如可能引起重要的高频部分同边界部分合并,不能保证分布系数彼此之间有正确的相同相位,以及可能引起第二个方向小波分解的不连续等。
七、总结
图像压缩技术研究了几十年,取得了很大的成绩,但还有许多不足,值得我们进一步研究。小波图像压缩和分形图像压缩是当前研究的热点,但二者也有各自的缺点,在今后工作中,应与人眼视觉特性相结合。总之,图像压缩是一个非常有发展前途的研究领域,这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。
参考文献:
[1] 田青. 图像压缩技术[j]. 警察技术, 2002, (1):30-31.
[2] 张海燕, 王东木等. 图像压缩技术[j]. 系统仿真学报, 2002, 14(7):831-835.
[3] 张宗平, 刘贵忠. 基于小波的视频图像压缩研究进展[j]. 电子学报, 2002, 30(6):883-889.
[4] 周宁, 汤晓军, 徐维朴. jpeg2000图像压缩标准及其关键算法[j]. 现代电子技术, 2002, (12):1-5.
[5] 吴永辉, 俞建新. jpeg2000图像压缩算法概述及网络应用前景[j]. 计算机工程, 2003, 29(3):7-10.
[6] j m shaprio. embedded image coding using zerotree of wavelet coefficients[j]. ieee trans. on signal processing, 1993, 41(12): 3445-3462.
[7] a said, w a pearlman. a new fast and efficient image codec based on set partitioning in hierarchical trees[j]. ieee trans. on circuits and systems for video tech. 1996, 6(3): 243-250.
[8] d taubman. high performance scalable image compression with ebcot[j]. ieee transactions on image processing, 2000, 9(7): 1158–1170.
[9] 徐林静, 孟利民, 朱建军. 小波与分行在图像压缩中的比较及应用. 中国有线电视, 2003, 03/04:26-29.
[10] m gilge, t engelhardt, r mehlan. coding of arbitrarily shaped image segments based on a generalized orthogonal transform[j]. signal processing: image commun., 1989, 1(10): 153–180.
[11] t sikora, b makai. shape-adaptive dct for generic coding of video[j]. ieee trans. circuits syst. video technol., 1995, 5(1): 59–62.
[12] t sikora, s bauer, b makai. efficiency of shape-adaptive 2-d transforms for coding of arbitrarily shaped image segments[j]. ieee trans. circuits syst. video technol., 1995, 5(3): 254–258.
[13] e jensen, k rijk, et al. coding of arbitrarily shaped image segments[c]. proc. workshop image analysis and synthesis in image coding, berlin, germany, 1994: e2.1–e2.4.
[14] m bi, s h ong, y h ang. comment on “shape-adaptive dct for generic coding of video”[j]. ieee trans. circuits syst. video technol., 1996, 6(6): 686–688.
[15] p kauff, k schuur. shape-adaptive dct with block-based dc separation and delta dc correction[j]. ieee trans. circuits syst. video technol., 1998, 8(3): 237–242.
[16] o egger, p fleury, t ebrahimi. shape-adaptive wavelet transform for zerotree coding[c]. proc. eur. workshop image analysis and coding for tv, hdtv and multimedia application, rennes, france, 1996: 201–208.
[17] o egger. region representation using nonlinear techniques withapplications to image and video coding[d]. ph.d. dissertation, swiss federal institute of technology (epfl), lausanne, switzerland, 1997.
[18] s li, w li, et al. shape adaptive vector wavelet coding of arbitrarily shaped texture[s]. iso/iec jtc/sc29/wg11, mpeg-96-m1027, 1996.
[19] w li, f ling, h sun. report on core experiment o3 (shape adaptive wavelet coding of arbitrarily shaped texture)[s]. iso/iec jtc/sc29/wg11, mpeg-97-m2385, 1997.
[20] s li ,w li. shape adaptive discrete wavelet transform for coding arbitrarily shaped texture[c]. proc. spie vcip’97, 1997, 3024: 1046–1056.
[21] s li, w li, et al. shape adaptive wavelet coding[c]. proc. ieee int. symp. circuits and systems iscas’98, 1998, 5: 281–284.
[22] s li, w li. shape-adaptive discrete wavelet transform for arbitrarily shaped visual object coding[j]. ieee trans. circuits syst. video technol., 2000, 10(5): 725–743.