数字图像处理
Contents
第一章 绪论
第二章 数字图像基础
2.1.2 眼睛中图像的形成
晶状体中心和视网膜沿视轴的距离大约是17mm,焦距约为14-17mm
2.1.3 亮度适应和辨别
人的视觉系统能够适应光强度级别范围是很宽的——从暗阈值到强闪光越有10^{10}个量级
主观亮度是进入人眼的光强的对数函数,在亮视觉中,光强范围大约是10^6的。暗视觉 0.01-0.1ml(朗伯)(在对数坐标中为-3~-1ml)。
\Delta I_c/I称为韦伯比,其中 \Delta I是在北京照明为I时可辨别照明增量的50% ,韦伯比较小意味着可辨别强度较小的百分比变化,表示亮度辨别能力较好。
马赫带效应:视觉系统往往会在不同强度区域边界出现“下冲”或“上冲”现象,虽然条带的强度恒定,但在靠近边界处我们实际上感知到了带有毛边的亮度模式
同时对比现象:感知区域亮度并不简单取决于强度。同样的强度的中心方块,随着背景变得更亮,他们在眼睛里会变得更暗。
错觉:眼睛填充了不存在的信息或者错误地感知了物体的几何特点。错觉是人类视觉系统的一种特性,但这一特性尚未被人类完全了解。
2.2 光和电磁波谱
\lambda=c/v ,其中,C是光速(2.998×10^8 m/s)
电磁波的各个分量的能量:E=hv,其中h是普朗克常数,波长的单位是米,最常用的是微米和纳米。频率用赫兹表示,1hz表示正弦波每秒一个周期。常用能量单位是电子伏特。
单色光或无色光没有颜色的光,唯一属性是它的强度或大小。因为感知单色光的强度从黑色到灰色,最后到白色,灰度级通常用来表示单色光的强度
有三个基本量来描述彩色光源的质量:发光强度、光通量、亮度。
发光强度是光源流出能量的总量,通常用瓦特(W)来度量。
光通量给出观察者从光源感受到的能量,用流明数(lm)度量。例如从远红外光谱范围的光源发射出的光具有实际的能量,但观察者很难感知到它,他的光通量几乎是零。
亮度是光感知的主观描绘子,他实际上不能度量,他具体体现了强度的无色概念,是描述彩色感觉得参数之一。
要求“看到”一个物体的电磁波的波长必须小于等于物体的尺寸。例如,水分子直径是10^{-10}m,若要研究该分子,则需要一个能在远紫外软X射线范围发射的光源。这个限制与传感器的物理特性一起确立了成像传感器功能的基本闲置。
2.3.4 简单的图像形成模型
用形如f(x,y)的二维函数来表示图像,在空间坐标(x,y)处,f的值或幅度是一个正的标量,其物理意义有图像源决定。
函数f(x,y)可由两个分量来表征:(1)入射到被观察场景的光源照射总量;(2)场景中物体所反射的光照总量,这两个分量分别成为入射分量和反射分量,分别表示为i(x,y)和r(x,y)。
其中 0<i(x,y)<\infty
和0<r(x,y)<1
令单色图象在任何坐标(x_0,y_0)处的强度(灰度)表示为
L_{min}=i_{min}r_{min}和L_{max}=i_{max}r_{max}
区间[L_{min} ,L_{max}]称为灰度级或强度级
2.4 图像取样和量化
对坐标值进行数字化称为取样,对幅值数字化称为量化。
由衣服图像的坐标张成的实平面部分称为空间域,x和y称为空间变量或空间坐标。
灰度级典型的取为2的整数次幂,L=2^k.
有时,有灰度跨越的值域非正式的称为动态范围。我们将图像系统的动态范围定义为系统中最大可度量的灰度与最小可检测灰度之比。上限取决于饱和度,下限取决于噪声。
对比度:我们定义衣服图像中最高和最低灰度级间的灰度差。
存储数字图像所需的比特数b为:
2.4.3 空间和灰度分辨率
空间分辨率可又有很多方法来说明,其中每单位距离线对数和每单位距离点数(像素数)是最通用的度量。线宽为W个单位,线对的宽度就是2W,单位距离有1/2W个线对.
低分辨率的图像与原图像相比要小
分辨率可以说高低大小,像素点只有多和少只说,没有大和小的说法。像素点是构成分辨率的最基础的单位,只能说多和少,没有大和小的说法,分辨率越高,像素点越多。图片当然越大了。
因为桌面图标的分辨率大小是固定的,有常见的有3232/6464/144*144三种。电脑分辨率越大,上边那几个分辨率当然越渺小了。就像你坐飞机往下看一下,下边的建筑物大小是固定的,你的视野范围越大,建筑物当然显得越小。
2.4.4 图像内插
内插是用以及数据来估计未知位置的数值的处理
最近邻内插法假设一幅图500X500像素,要扩大到750×750,则先创建一个假象的750×750网格,他与原始图像有相同的间隔,然后手术哦,使他准确与原图像匹配,为了对覆盖的每一个点赋以灰度值,在原图像中寻找最接近的像素,并把该像素灰度赋给750×750网格中的新像素,然后扩展到原来规定大小。
双线性内插法该方法中,我们用4个最近邻去估计给定位置的灰度。令(x,y)为我么想要复以灰度值的位置的坐标,并令v(x,y)表示灰度值,对于双线性内插来说,赋值由下列公式得到
双线性内插法不是线性内插方法,因为包含xy项
双三次内插法
双三次内插是商业图像编辑程序的标注内插方法
2.5 像素间的一些基本关系
2.5.1 相邻像素
位于坐标(x,y)处的像素p有4个水平和垂直的相邻像素,这组像素成为p的4邻域,用N_4(p)表示。
p的对角相邻像素用N_d(4),这些点和4个邻点一起成为p的8邻域,用N_8(p)
2.5.2 邻接性、连通性、区域和边界
a. 4邻接。如果q在集合N_4(p)中,则具有V中数值的两个像素p和q是4邻接的。
b. 8邻接。如果q在结婚N_8(p)中,则具有V中数值的两个像素p和q是8邻接的。
c. m邻接。如果(1)q在N_4(p)中,或(2)q在N_D(p)中,且集合N_4(p) \cap N_4(q)中没有来自V中数值的像素,则具有V中数值的两个像素p和q是m邻接的。
如果S的全部像素之间存在一个通路,则可以说两个像素p和q在S中是连通的。对于S中任何像素p,S中连通到该像素的像素集称为S的连通分量。如果S仅有一个连通分量,则集合S称为连通集
令R是图像中的一个像素子集,如果R是连通集,则称R为一个区域。两个区域,如果他们联合形成一个连通集,则区域R_i和R_j成为邻接区域。不邻接的区域成为不连通区域。
假设一幅图像包含有K个不连接区域,即R_k,k=1,2,3,…,K,且他们都不接触图像的边界。令R_u代表所有K个区域的并集,并且令(R_u)^c代表其补集。我们称R_u中所有点为图像的前景,而称(R_u)^c中的所有点为图像的背景。
区域R的边界也成为边缘或轮廓,是这样的集合,这些点与R的补集中的点临近。一个区域及其北京中的点之间的邻接要根据8连通来定义。
前述定义有时成为区域的内编辑,以便与其外边界相区分,外边界对应于背景边界。
2.5.3 距离度量
对于坐标分别为(x,y),(s,t)和(v,w)的像素p,q和z,如果
& D(p,q) \geq 0 [D(p,1)=0,当且仅当p=q] \\
& D(p,q) =D(q,p)且 \\
& D(p,z)\leq D(p,q)+D(q,z) \\
\end{align}
则D是距离函数或度量,p和q的欧几里得距离定义如下:
对于距离度量,距点(x,y)的距离小于或等于某个值r的像素是中心在(x,y)且半径为r的圆平面
p和q间的距离D_4又成为城市街区距离,由下式定义:
在这种情况下,距(x,y)的距离D_4小于或等于某个值r的像素形成的一个中心在(x,y)的菱形。
p和q间的D_8距离(又称为棋盘距离)由下式定义:
在这种情况下,距(x,y)的D_8距离小于或等于某个值r的像素形成中心在(x,y)的方形。
如果选择考虑m邻接,则两点间D_m距离用点间的最短通路定义,在这种情况下,两个像素间的距离将依赖于沿通路的像素值及其邻点值。
2.6.2 线性操作与非线性操作
图像处理方法的最重要分类之一是它是线性的还是非线性的。考虑一般的算子H,该算子对于给定的输入图像f(x,y),产生一幅输出图像g(x,y):
如果
则称H是一个线性算子。输出是一个线性操作,因为两个输入的和与分别对输入进行操作然后再求和得到的结果相同。
针对降噪的带噪图像相加(平均)
增强差别的图像相减
使用图像相乘和相除来校正阴影,图像相乘的另一个普遍应用是模板操作,也成为感兴趣区域(ROI)操作
几何变换改进图像中像素间的空间关系。这些变换通常称为橡皮膜变换,因为他们可看成是在一块橡皮膜上印刷一幅图像,然后根据预定的一组规则拉伸该薄膜。在数字图像处理中,几何变换由两个基本操作组成:(1)坐标的空间变换;(2)灰度内插
Filed under: 图像处理 - @ 2022年1月18日 上午11:51