数学建模社区-数学中国
标题:
数字图像的压缩与恢复
[打印本页]
作者:
wz3118103
时间:
2010-5-20 03:22
标题:
数字图像的压缩与恢复
一个图像是如何数字化的呢?不妨从一张玩具鸭子图片说起。
7 V* s/ [$ \. r3 a3 D
2010-5-20 03:22 上传
下载附件
(96.48 KB)
4 k0 m+ _6 Y$ u$ s' ~7 F! V( b+ \
首先要把图片打格子分成若干小块,每块用一个数字来表示一种颜色。如果图像是纯黑白两色的,那每块只用1或0表示即可。若图像是16色的,每块用4位二进数表示,因为2^4=16,即4位二进制有16种组合,每种组合表示一种颜色就行了。真彩色位图的每个小块,都是由不同等级的红绿蓝三种色彩组合的,如图所示,每种颜色有2^8个等级,所以共有2^24种颜色, 因此每小块需要24位二进制数来表示。
0 o# J( i$ a2 }' ~/ X% f
0 T3 z6 F/ h# K: g e7 V- X' w8 p, ?
可见,数字图像越艳丽,则需要记录的二进制数就越多越长。除此之外,打的格子越密,则一副图的总数据量就越大,此例中鸭子图片分成了11×14=154块,按真彩色位图来计算,则总数据量为154×24=3696比特。这些小格子显然是太大了,不能表现图片的细节,实际中的格子要密得多,例如1024×768,这是大家都熟悉的显示分辩率。
1 g! {+ O& F/ ~0 K# A2 O! e
9 Y6 l d' N% X0 m- I3 W" \5 a
看这张滑雪图,人体的色彩变化比较大,而天空和雪的色彩却非常单调,可以想象,代表每个小格颜色的数值也应该非常接近,图右下的原始数据是8个相邻格子的色彩数据,由于两个相邻格子的数据差异很小,所以可以用第一个格式数据当作第二个格子数据的预测值,经实际测量后,把真实值与预测值的差值求出来,并用这个差值来表示第二个格子的色彩。那么,实际记录下的就是第三行差值。但恢复数据时,用前面一个值加上差值,就是当前的色彩值,只要有第一位的基础值,后面的色彩值就可以滚雪球式的一个个求出来。
2 L; G1 L$ Y! o+ F
' a8 f9 o/ U; v6 [) m
用差值来记录色彩,只是简单地进行了很多个减法运算,在还原时再加回来,数据并没有一丁点的损失,因此被称为无损压缩,如果把很少的差值彻底丢弃,在还原时把一个格子的色彩信息代表了周围很多格子的色彩,则压缩率更高,但格子之间的微小差别就丢失了,这种方法属于有损压缩。
0 Q( q0 d" z% _6 c/ h
* O1 [. V) c. Q
位图是每个格子都独立记录的,因此数据量很大,这就是bmp格式,而经过了上述的预测差值运算后,就变成了有损压缩格式,jpg格式就是其中之一。画质基本相同的两幅图,jpg格式的数据量要比bmp小得多。jpg是有损压缩的,但画质的损失非常小。Jpg格式是很智能的,例如对上面有大面积相似色彩的山水照给予较大的压缩率,而对非常热闹的人群照给予较小的压缩率。
+ y4 B! s" Y1 r' l. N; p$ f
. Y2 x% {( v( B
上面说的只是静态的图像,而视频图像压缩得更大,一秒钟视频会切换几十张画面,而这些画面的绝大部分都是相同的,采集是每幅都是独立采的,生成的avi格式的数据量是很大的,不仅每幅画面本身可以压缩,更重要的是幅与幅之间也可以压缩,这就形成了数据量小得多的mpeg格式。也可以采用压缩率更高的rm格式,rm格式的画质比mpeg差得不多,但数据量却小了很多倍,更方便在网上传输。
* T" f* R) R! ]! R6 a! `, C9 ]
J# @0 D7 [5 e
不同的视频,幅与幅之间的相似度是不同的,韩剧的相似度很大,甭说一秒了,甚至几分钟内演员都坐在沙发上聊,除了嘴巴外每幅画面都基本一样,对这种视频可以采用较大的压缩率,而对动感性很强的武打片,则采用较小的压缩率,这种格式就是rmvb。跟rm格式不同的是,它的压缩率是可变的,vb就是可变比特率的意思。rmvb比rm更先进,相同数据量的rmvb视频会比rm视频清晰,而相同清晰度的视频,rmvb格式的数据量会更小。
$ i8 G0 H5 U" F; Y8 m+ V3 _+ |1 i
+ d+ i$ |+ r! ?* h* J3 V
一旦进行了有损压缩,数据缺失了,画质就很难复原了,但这也并不是不可能,这里面有个关键的概念–先验信息。例如这张****黑白照片的嘴唇,要压缩成这个灰度,右侧的彩色图例中有五种可能,但通过先验信息(先验信息也就是我们以前已经知道了的知识)知道,**的嘴唇不可能是绿的、蓝的和紫的,只能是右下的红色,把它还原成红色就对了。
) R) s+ F+ Y8 V2 T% |( l
, Q/ q1 U% ^7 I& I( B0 A
# C8 F4 L9 `/ }) o7 f! n
钢琴和弦的每一小组乐音都是由不超过五个纯音符的组合,这些排列组合的总数还是不少的,但好在根据先验信息我们知道,只有极少数的组合是经常出现的,绝大多数的组合是基本不会出现的,如果我们得到了一组模糊不清的组合,它跟经常出现的某个组合与基本不会出现的某个组合的相似度一样,那我们就毫不犹豫地认定它就是那个经常出现的组合。
. u( t0 m$ k$ k0 J: W8 C
/ L7 x3 X( [. D! a
当然,实际上它不是那个经常出现的组合,而是那个基本不会出现的组合,这种可能性也是不能排除的,就好比那个****真的长了一副蓝嘴唇一样,我们依靠先验信息做的判断就杯具了,但这是没办法的事。
6 m0 k' p! D' C6 i; p' ~2 Z; K
j2 f; z0 ?1 ?+ n* t2 Y
现在的核磁共振技术在短时间内只能获得比较粗糙的图像,但我们知道被照器官的每一小块部分与相邻部分的相关性是很强的,而且我们对这些器官也具有很多先验信息,这就可以帮助我们像还原****图那样,在粗糙的图像上还原出高画质的图像,可信度还可以做得非常高。
p450375205.jpg
(96.48 KB, 下载次数: 194)
2010-5-20 03:22 上传
点击文件名下载附件
作者:
闾山
时间:
2010-5-20 12:18
matalb图像处理吗??????????
作者:
fenglibo
时间:
2010-5-20 18:02
提出有效算法后,可以用计算机进行模拟嘛。
作者:
咫尺天涯
时间:
2010-6-4 13:29
谢谢!!!!!!!!!
作者:
alair002
时间:
2012-2-5 19:53
厚积薄发,这是真理
4132331015267682
作者:
alair002
时间:
2012-2-6 08:17
我一天不来数学中国社区就不爽~~~~
226292154336059
作者:
fengzhicool
时间:
2012-2-16 09:59
很好,很详细
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5