大家好,欢迎来到IT知识分享网。
最近想了解下ocr相关的知识,一些基础知识做个记录。
什么是图像?
定义为二维函数f(x,y),其中,x,y是空间坐标,f(x,y)是点(x,y)的幅值。
灰度图像是一个二维灰度(或亮度)函数f(x,y)。
彩色图像由三个(如RGB,HSV)二维灰度(或亮度)函数f(x,y)组成。
什么是数字图像?
1. 像素组成的二维排列,可以用矩阵表示。
2. 对于单色(灰度)图像而言,每个像素的亮度用一个数值来表示,通常数值范围在0到255之间,0表示黑、255表示白,其它值表示处于黑白之间的灰度。
3. 彩色图像可以用红、绿、蓝三元组的二维矩阵来表示。
通常,三元组的每个数值也是在0到255之间,0表示相应的基色在该像素中没有,而255则代表相应的基色在该像素中取得最大值。
数字图像的像素表示
什么是像素?
数字图像由二维的元素组成,每一个元素具有一个特定的位置(x,y)和幅值f(x,y),这些元素就称为像素
图像的采样和量化
大多数传感器的输出是连续电压波形
为了产生一幅数字图像,需要把连续的感知数据转化为数字形式
这包括两种处理:取样和量化
取样:图像空间坐标的数字化
量化:图像函数值(灰度值)的数字化
图像采样
空间坐标(x,y)的数字化被称为图像采样
确定水平和垂直方向上的像素个数N、M
图像的量化
函数取值的数字化被称为图像的量化,如量化到256个灰度级
图像的采样和量化
非统一的图像的采样
在灰度级变化尖锐的区域,用细腻的采样,在灰度级比较平滑的区域,用粗糙的采样
非统一的图像的量化
在边界附近使用较少的灰度级。剩余的灰度级可用于灰度级变化比较平滑的区域
避免或减少由于量化的太粗糙,在灰度级变化比较平滑的区域出现假轮廓的现象
数字图像的表示
二维离散亮度函——f(x,y)
x,y说明图像像素的空间坐标
函数值f 代表了在点(x,y)处像素的灰度值
二维矩阵——A[m,n]
m , n说明图像的宽和高。
矩阵元素a(i,j)的值,表示图像在第i行,第j 列的像素的灰度值;i,j表示几何位置
图像的质量:1、层次
灰度级:表示像素明暗程度的整数量
例如:像素的取值范围为0-255,就称该图像为256个灰度级的图像
层次:表示图像实际拥有的灰度级的数量
例如:具有32种不同取值的图像,可称该图像具有32个层次
图像数据的实际层次越多,视觉效果就越好
图像的质量:2、对比度
对比度:是指一幅图像中灰度反差的大小
对比度= 最大亮度/ 最小亮度
图像的质量:3、清晰度
与清晰度相关的主要因素
亮度
对比度
尺寸大小
细微层次
颜色饱和度
像素间的一些基本关系
相邻像素:
4邻域
D邻域
8邻域
连通性
4连通
8连通
m连通
距离
相邻像素——4邻域
4邻域:像素p(x,y)的4邻域是:
(x+1,y);(x-1,y);(x,y+1);(x,y-1)
用N4(p)表示像素p的4邻域
相邻像素——D邻域
D邻域定义:像素p(x,y)的D邻域是:
对角上的点(x+1,y+1);(x+1,y-1);(x-1,y+1);(x-1,y-1)
用ND(p)表示像素p的D邻域
相邻像素——8邻域
8邻域定义:像素p(x,y)的8邻域是:
4邻域的点+ D邻域的点
用N8(p)表示像素p的8邻域。
N8(p) = N4(p) + ND(p)
像素间的连通性
连通性是描述区域和边界的重要概念
两个像素连通的两个必要条件是:
两个像素的位置是否相邻
两个像素的灰度值是否满足特定的相似性准则(或者是否相等)
4连通、8连通、m连通的定义
像素的连通性——4连通
对于具有值V的像素p和q,如果q在集合N4(p)中,则称这两个像素是4连通的
像素的连通性——8连通
对于具有值V的像素p和q,如果q在集合N8(p)中,则称这两个像素是8连通的
像素的连通性——m连通
对于具有值V的像素p和q,如果:
I. q在集合N4(p)中,或
II. q在集合ND(p)中,并且N4(p)与N4(q)的交集为空(没有值V的像素),则称两个像素是m连通的,即4连通和D连通的混合连通。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/29656.html