imgProc-烤漆总结
8章
模式识别的系统框图
直方图 均衡化
log算子
图像描述子,什么性质
1229
第一章
数字图像表达方式
链码
1.3-1.4简答题
第二章
2.1.4
噪声
2.4 图像评价,主观客观
2.5 彩色图像基础知识
彩色模型
第三章
二位连续函数、狄拉克、傅立叶函数等,例题
离散傅立叶变换、性质
都重要
沃尔什、哈达码,核,DCT(非计算)
哈尔变换、kl、小波不考
第四章
图像压缩,换算
熵编码、熵、平均码字长度、相关概念
哈夫曼编码
香农
算术编码
游程长度编码不考
DPCM(插值脉冲编码)
降质原因
jpeg压缩流程
国际标准
第五章
图像处理增强与复原
直方图均衡、修正
同态增析原理
平滑,方式、各种滤波算法、功能
锐化:梯度、拉普拉斯
几何校正
5.7-9不考
第六章
各种算子
Marr先干啥后干啥,log滤波器是什么
沈俊、facet、模版匹配不考
hough变换
阈值分割方法,原理等
模糊阈值分割不考
区域增长法等
数学形态学概念
第七章
几何特性、概念
灰度共生矩阵
矩不变量的性质
边界描述、链码
什么纹理对应什么东西
第八章
ppt为准
模式识别流程及其环节
分类决策依据
贝叶斯
第一章 绪论
图像
定义:人对视觉感知的物质再现
图像处理
定义:对图像信息进行加工处理,以满足人的视觉心理和实际应用的要求
分类:
-
模拟图像处理
-
并行速度快,精度差,不灵活
-
-
数字图像处理
-
精度高、灵活、处理速度受限(GPU并行化)
-
图像空间数字化:采样
图像幅值数字化:量化
数字图像处理特点
-
处理二维信息,信息量大
-
数字图像传输占用的频带较宽
-
数字图像时空相关性强
-
二维图像是三维世界投影
-
数字图像的主观质量和客观质量
第二章 图像信息的基本知识
图像信息的获取与显示技术
图像分辨率:
-
图像的像素密度,图像分辨率高表示组成该图的像素点数量多,图像更清晰。
显示分辨率:
-
实际显示图像用的分辨率,与计算机硬件设备有关
图像色深:
-
在某一分辨率下,每一个像素点可以有多少种色彩来描述,它的单位是bit (位)
-
色深越小,色彩断层越明显,色深越大色彩变化越细腻
图像信息技术中的视觉研究
视觉研究与图像技术的关系
-
图像信息的信宿:人的视觉系统
图像质量评价与视觉心理
-
对图像的认识和理解:感觉和心理状态决定
-
主观评价:由人参与的评价
-
客观评价:只由机器决策的评价
画面的组成与视觉心理
-
人的视野:左右视角120-180度,上下视角30-60度
视觉信息的产生、传递和处理
视觉的特性
主观亮度感觉:韦伯-弗赫涅尔定律
-
-
S:主观感觉亮度
-
B:光强
视觉模型
图像数字化
定义:将代表图像的连续(模拟)信号转变为离散(数字)信号
-
采样:图像在空间上的离散化
-
量化:对样点灰度值的离散化过程
图像的噪声分析
高斯噪声:
-
-
应用最广泛的的噪声模型
噪声分类
-
根据噪声产生的原因:
-
外部噪声
-
内部噪声
-
-
根据统计理论观点
-
平稳噪声
-
非平稳噪声
-
-
根据噪声幅度分布
-
高斯噪声
-
瑞利噪声
-
伽马噪声
-
-
根据频谱形状
-
白噪声:频谱均匀分布
-
噪声:频谱与频率成反比
-
三角噪声:频谱与频率平方成正比
-
-
根据噪声与图像的结合方式
-
加性噪声:
-
乘性噪声:
-
图像的质量评价
客观评价:容易,固定计算方法,不一定反应图像真实质量
-
灰度图像的失真度量
-
归一化的均方误差:
-
峰值均方误差:
- 图像灰度最大值:0-8bit=255,A=256
-
等效的峰值信噪比:
- 单位:dB分贝
-
灰度图像的失真度量主观评价:实现困难,不同情况影响较大,图像评估的最终目标
-
人作为图像的观察者
-
DMOS计算
彩色图像基础知识
RGB模式:
-
加式模式:R+B+G
CMYK模式(印刷彩色):
-
减式模式:吸收一部分光线,剩下光线反射
第三章 图像变换
概述
为什么要进行图像变换
-
高效、快速地对图像进行 处理和分析
-
为顶层(high-level)应用提供特征
图像变换的二维线性系统描述
-
-
非因果系统
图像的线性运算
二维连续线性系统
-
系统连续:其冲激响应为的连续函数
-
叠加原理:
二维狄拉克冲激函数
-
-
筛选性
-
可分离性
二维冲激响应函数:以二维狄拉克冲激函数作为输入时系统的输出相应函数
-
-
点扩散函数
-
空间不变系统
卷积
图像卷积:二维离散卷积
-
互相关:
二维连续傅立叶变换
一维连续傅立叶变换:
-
-
-
频谱(傅立叶谱):
-
其平方:能量谱、功率谱
-
二维连续傅立叶变换:
二维离散傅立叶变换及其性质
DFT概念:
-
建立了离散时域和离散频域之间的联系
-
减少了计算量,提高了处理速度
-
有快速算法FFT
二维离散傅立叶变换:
性质:
-
线性:
-
可分离性:二维可分解为两个一维
-
傅立叶变换对的平移性:空域移动,频域只发生相移,幅值不变
-
周期性、共轭对称性
-
旋转不变性:空域旋转,时域也相同旋转
-
分配性和比例性:加法可分配、乘法不可分配;时域紧缩等价于频域展开
-
平均值:傅立叶变换原点与图像像素平均值有关,称为直流分量
-
卷积定理:
-
-
-
时域卷积频域乘积,时域乘积频域卷积
-
离散图像变换的一般表达式
代数表达式
-
变换核:
-
-
-
:变换核可分离
-
矩阵表达式
-
;
-
离散沃尔什-哈达玛变换
沃尔什变换核:可分离、对称
二维沃尔什变换矩阵表示
能量集中特性:数据分布方差越小,变换后越集中于角上,可用于压缩图像
哈达玛变换:特殊排序的沃尔什变换
-
优点:变换核矩阵具有简单的递推关系
-
可分离、对称
-
-
离散余弦变换DCT
一维DCT:
-
-
-
计算速度快
第四章 图像压缩编码
概述
为什么要压缩:
-
多媒体通信迅猛发展
-
频谱资源匮乏
-
需要带宽受限下的多媒体传输
图像压缩目的
-
图像数据显著特点:数据量大,对存储和网络传输造成极大的负担
-
解决办法:进行图像压缩(编码),压缩后存储并传输,需要时解压还原
-
出发点:整体数据冗余度很大
图像编码分类
信息保持编码(无损编码)
-
不丢失任何信息
保真度编码(有损编码)
-
压缩中可丢失一些人无法感知的信息
特征编码(感兴趣区域编码)
-
只保留相关特征信息
图像传输框图
图像编码通道编码通道通道解码图像解码
图像编码框图
图像变换量化熵编码
图像解码框图
符号解码图像反变换
熵编码
自信息量:
熵
平均码字长度
编码效率
-
-
香农信息论:信源熵是无失真编码的理论极限
变长最佳编码定理
-
在变长编码中,对出现概率大的信息符号赋予短码字,而对于出现概率小的信息符号赋予长码字。如果码字长度严格按照所对应符号出现概率大小逆序排列,则编码结果平均码字长度一定小于任何其他排列方式。
可变长最佳编码的平均码字长度
-
-
码字长度由信息符号出现的概率决定
唯一可译码
存在的充要条件:Kraft不等式
-
-
非续长码(前缀码)一定是单义码
哈夫曼编码
-
编码
-
计算
香农编码
-
概率从大到小
-
-
累加概率,
-
转二进制,去除尾数
香农编码效率低于哈夫曼编码
算数编码
-
思想:0-1线段上的一个区间定义一段消息序列
-
源符号和码字间的一一对应关系并不存在
-
新字区左端=前子区左端+字符子区左端前子区长度
-
新子区长度=前子区长度字符子区长度
预测法编码
分类
-
线性预测:差值脉冲编码调制法(DPCM)/非线性预测
-
帧内/间预测法(一副或多幅图像之间进行)
DPCM基本原理
-
预测编码是利用相邻像素的相关性进行预测 。预测编码通常不是直接对信号编码 ,而是对预测误差编码 。当预测比较准确,误 差较小时, 可达到编码压缩的目的 。这种编码被称为差分脉冲编码(DPCM)。
DPCM组成:
-
量化器
-
预测器:应用预测误差的均方误差为极小值准则来获得的DPCM,称为最佳线性预测(不造成压缩损失)
最佳预测
-
前值预测:用现在像素同一扫描行中前面最邻近像素值来预测X
-
一维预测:用X的同一扫描中前几个已知像素值来预测X
-
二维预测:用x的同一行和前几行若干个已知像素值
-
三维预测:用前几行、前几帧的已知像素
最佳量化器
-
图像中灰度变化快的部分,主观察觉不出的量化误差绝对值大
变换编码
图像压缩编码主要国际标准
JPEG静态图像压缩标准
-
8*8DCT
-
DC系数进行DPCM编码和AC系数进行哈夫曼编码
JPEG2000静态图像压缩标准
-
小波变换+自适应算数编码
动态图像(视频)压缩标准
-
I帧:帧内编码帧
-
P帧:前向预测编码帧
-
B帧:双向预测内插编码帧
常见
-
H.262/MPEG-2标准推动了模拟电视到数字电视的变革
-
H.264/AVC使得高清视频和互联网视频得以广泛推广
-
H.265/HEVC则成功推动 4K超高清视频的普及
-
H.266/VVC则对8K超高清等
第五章 图像增强和复原
概述
对降质图像的改善处理:增强与复原
-
图像增强:提高图像的可懂度
-
图像复原:提高图像的保真度
灰度修正
灰度变换:
-
设原图像的灰度级分布在区间(A,B), 为了将整个区间或其中的某一段扩展或压缩到 另外一个灰度区间 ( Z l , Z k ) 以符合图像记录设备 的动态范围,要采用灰度变换。
直方图修正
-
直方图均匀化增加了图像灰度动态范围 , 增加了图像的对比度 , 反映在图像 上就是图像有较大的反差 、 许多细节可看得比较清晰 。
-
图像与直方图不是一一对应,经常用频率代频数(归一化)
-
计算,并寻找最接近的作为新的灰度级
图像的同态增晰
-
灰度动态范围很大的图像,黑的很黑,白的很白,需要突出某小范围的灰度级区域时,采用灰 度变换可能无法满足要求。
-
同态滤波处理
平滑
目的:减少图像中的噪声
方法:
-
空域:邻域平均
-
频域:低通滤波器(噪声主要分布在高频段)
常见噪声:
-
加性噪声
-
乘性噪声
去噪以图像细节模糊为代价
空域平均:
-
对像素取邻域S(4/8),计算均值:
-
噪声的标准差为原来的
-
平滑窗口越大,噪声消除增强,但图像变模糊
频域平均
-
低通滤波:先FFT再低通滤波器在逆FFT
-
图像细节也是高频分量,故会导致边缘模糊
-
理想低通滤波器、巴尔沃兹滤波器、指数滤波器、梯形滤波器
中值滤波
-
非线性信号处理方法
-
一定条件下,克服线性滤波器等带来的图像细节模糊
-
不适合细节多图像,处理脉冲(椒盐)噪声有效
-
原理:用一个奇数点的滑动窗口,将窗口中 心点的值用窗口内各点的中值代替。
-
比邻域平均处理的滤波效果好:轮廓清晰
-
顺序统计滤波器:最大值、最小值滤波器
锐化
-
使边缘和轮廓模糊的图像变得清晰,并使其细节清晰
-
模糊原因:
-
时域平均或积分:微分法
-
频域高频分量衰减:高通滤波器
-
-
处理图像有较高的信噪比:否则图像锐化后, 噪声受到比信号还强的增强。一般是先去除或减轻干扰噪声后,才能进行锐化处理。
微分法
梯度:
-
-
方向:函数最大变化率方向
-
幅度:最大变化率(量)
数字图像梯度:
-
-
上下差+左右差
罗伯特梯度:
-
-
左对角线差+右对角线差
拉普拉斯运算
-
拉普拉斯算子:
-
锐化图像变换为:
-
图像离散化公式:
- 上下左右之和减去4倍中心
高斯滤波器滤波+拉普拉斯算子=最佳边缘检测器之一
高通滤波:
-
增强图像的边缘与细节
几何校正
几何畸变原因:在成像过程中成像设备姿态的变化,成像光学系统和电子扫描系统的失真等
-
非系统畸变
-
系统畸变
定义:从含有几何畸变的图像中除去畸变的过 程。
流程:
-
畸变前后坐标系关系:
已知畸变过程
-
临近点插值:最接近的数字化格点,用其灰度值表示g中
-
双线性差值:周围四邻的网格点的灰度值内插作为g中
未知畸变过程:
-
近似认为线性:待定系数解方程组
第六章 图像分割
概述
图像分割:按照一定的规则将一幅图像或景物分成若 干部分或子集的过程…
分类:
-
相似性分割
-
非连续分割
-
两种方法互补,应该有机结合
边缘检测算子
边缘检测:图像局部特性的不连续性的形式出现,从本质上说,边缘意味着一个区域的终结和另一个区域的开始。可用于图像分割。
简单边缘检测算子
梯度算子:差分代替微分
-
Robert梯度:对角线方向像素之差
-
Sobel梯度算子:先加权平均后微分
拉普拉斯算子:标量,旋转不变/各向同性
Marr边缘检测算子
-
存在较大噪声的场合 , 由于微分运算会起到放大噪声的作用, 因此 , 梯度算子和拉普拉斯算子对噪声比较敏感。
-
先平滑抑制噪声,再进行微分
-
对图像进行局部线性拟合,然后再用拟合所得的光滑函数的导数来替代直接的数值导数
-
Marr边缘检测方法
-
基本原理:先对输入图像进行平滑滤波 , 以滤去噪声 。 然后再求一阶或二阶导数以检测边缘点。
-
可将平滑、微分运算合成一步
- 设计平滑滤波器
- 检测局部最大值或过零点
-
平滑滤波器条件
- :保证滤波后均值不变
- 一阶二阶可微
- 高斯滤波器!
-
-
(LOG,Laplacian of Gaussian)边缘检测算子:
- 高斯函数部分能把图像平滑、 有效地消除一切尺度远小于高斯分布因子的图像强度变化。
- 减少计算量
-
高斯平滑滤波器为低通滤波器。但高斯因子分布越大,对 较高频率的噪声抑制作用越大
Hough变换
-
将原始图像中给定形状的曲线或直线变换成变换空间中的一个点;原始图像中给定形状曲线或直线的检测问题,变成寻找变换空间中的峰点问题
-
xy平面(图像空间)的点对应斜率截距变换空间的一条直线
-
如果斜率不存在:极坐标
-
对应极坐标空间内的一条正弦曲线
-
图像阈值分割
概念:利用图像中要提取的目标物与其背景 在灰度特性上的差异, 把图像视为具有不同灰度级的 两类区域(目标和背景)的组合, 选取一个合适的阈值.以确定图像中每一个像素点应该属于目标还是背景区域.从而产生相应的二值图像
优点:大量压缩数据
阈值选取是图像阈值分割技术的关键
直方图阈值分割
-
简单的直方图分割:明显双峰的直方图,选取两峰之间的谷底的灰度级作为阈值
-
最佳阈值:使图像中目标物和背景分割错误最小的阈值
类间方差阈值分割
-
准则:类间方差最大,类内方差最小
-
基于最小二乘法
二维最大熵阈值分割
区域增长法和分开-合并区域方法
-
把图像分解为若干个有意义的子区间,每个子区间具有 一定的均匀性质。
-
这里讨论的区域分割,是直接根据事先确定的相似性准 则,直接取出若干特征相近或相同像素组成区域。
区域增长法
单连接区域增长技术:根据两个相邻像素点之间特征
混合连接区域增长法:根据像素邻域的相似性
中心连接区域增长的方法:满足某种相似性检测准则的点开始,在各个方向增长区域
-
平均灰度的均匀测度度量:相似性检测准则
-
设区域O,像素数N,均值
-
区域O均匀测度度量:
-
在区域O中,各像素灰度值与均匀值的差不超过某阈值K, 则其均匀测度度量为真
分开-合并区域方法
-
确定均匀性测试准则
-
将图像四叉树结构中的某一中间层作为初始的区域划分
-
区域合并
数学形态学
二值图像中的基本逻辑操作
-
与
-
或
-
非
二值数学形态学的基本运算
膨胀:A被B(结构元素)膨胀
-
-
含义:膨胀结果是把邻接背景与目标的背景像素置为目标像素,增加目标面积的作用。
-
B的中心在A的边缘移动所覆盖的外缘
腐蚀:A被B腐蚀
-
-
含义:腐蚀结果是把临近背景的目标像素值置为背景来达到缩小目标面积的作用。腐蚀为膨胀结果的补集。
-
B的中心在A的边缘移动所覆盖的内部
开:先用结构元B对A腐蚀,再进行膨胀
-
-
基本属性
- 开的结果是A的子集
- 对同样的A,多次开运算结果相同(幂等)
-
当B沿A的内部边界滚动时,B中所能达到的A的内部边界的最远的点。
闭:先用结构元B对A膨胀,再进行腐蚀
-
-
基本属性
- A是闭的结果的子集
- 对同样的A,多次闭运算结果相同(幂等)
-
当B沿A的外部边界滚动时,B中所能达到的B的外部边界的最远的点。
先开后闭:开消除噪声,闭修复开运算造成的断裂
边界抽取:
第七章 图像描述
概述
-
定义:用一组数量或符号(描述子)来表征图像中被描述物体的某些特征,可以是对图像中各组成部分的性质的描述,也可以是各部分彼此间的关系的描述。
二值图像的几何特征
邻接与连通
-
邻接:
-
4邻接:上下左右
-
8邻接:周围一圈
-
-
连通性:4/8连通
-
自反、对称、传递
-
背景与孔
包围与边界
目标物体的标记:顺序扫描
简单几何特性
-
面积:像素点数目
-
周长:
-
方格像素的边界线长度
-
点像素的边界8链码长度
-
边界面积(点数)之和
-
-
位置:质心
-
方向:最小惯量轴
-
投影:投影方向的像素个数
-
距离:非负、对称、三角不等式
-
欧几里得距离
-
4邻域距离:(正规距离)
-
8邻域距离:
-
点到子集的距离:点到子集所有点的最小值
-
二维形状描述
分散度:
-
,也称圆度(与圆的接近程度)
-
A为面积,P为周长
-
几何形状越复杂,分散度越大
-
具有二义性
伸长度:
-
-
A为面积,W为宽度(使S完全消失所需的最小收缩步数)
欧拉数:
-
-
C为连通分量个数,H为孔数
复杂性:主观性
偏心度:主轴与辅轴之比
矩不变量:
-
矩特征对于图像的旋转、比例、平移具有不变性
边界描述:
-
链码:逆时针0-7,原点出发的指向
-
旋转:mod 8的加法
-
长度:
-
链码规格化:闭合曲线起点与终点重合,通过改变起点位置, 使链码表示的整数最小
-
-
傅立叶算子:仅适用于单闭合曲线
二维纹理描述
纹理算法分类
-
统计分析:从图像有关属性的统计分析出发
-
结构分析:力求找出纹理基元,再从结构组成探索纹理的规律或 直接去探求纹理构成的结构规律
灰度共生矩阵法
灰度共生阵:定义为从灰度为i的点离开某个固定的位置 (相距d,方向为)的点上灰度为j的概率。往往适当地选择 d,而则取0,45,90,135度。
-
灰度共生矩阵并不能直接提供纹理信息,要进一步从中提取信息,常用的共五种。
角二阶矩(能量):灰度共生矩阵元素的平方和
惯性矩(对比度):
相关性
熵:纹理越多,熵值越大,信息量越多
局部均匀性(逆差矩):
傅立叶功率谱纹理分析法
-
功率谱的径向分布与图像 f(x,y) 空间域中的纹理的粗细程度有关
-
稠密细纹理:功率谱径向分布分散
-
稀疏粗纹理:功率谱的分布将偏置于与纹理垂直的方向
-
纹理的结构分析
-
确定纹理基元的方法:通过图像的区域分割或边缘、线 的抽取来提取纹理基元
-
纹理基元之间的结构关系:有多种途径进行研究,比较 简单的方法是分析纹理基元间存在的相位、距离、尺寸 等统计特性,也可以考虑用复杂的,如模型或句法等
第八章 图像识别
基本概念
-
图像识别的关键:目标分类
模式识别系统框图
输入数据获取预处理特征提取决策分类输出
数学观点:决策分类就是要找出决策函数(边界函数)
统计模式识别
线性决策函数
KNN算法
-
优点:精度高,对异常值不敏感,无数据输入假定区
-
缺点:计算复杂度高,空间复杂度高
KD树:二叉树
-
每个结点,对应于一个k维超矩形区域
似然函数模式分类
统计决策的决策函数:贝叶斯定理为基础
-
基于最小错误率的贝叶斯决策
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 lzhのBLOG!