复杂场景下条码自动实时定位外文翻译资料

 2022-11-12 07:11

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


复杂场景下条码自动实时定位

张春辉,王健,韩世汉,莫毅微软亚洲研究院,中国北京chhzhang,jianw@microsoft.com

张正友,微软研究部,华盛顿州雷德蒙,usahang@microsoft.com

摘要

有许多应用程序可以在复杂场景中使用相机自动查找和读取条形码。关键问题是在一个复杂的场景中搜索条形码并提供给一个读取子系统。然而,光照、旋转、透视失真和多重条码环境使得条码定位变得困难。通过对纹理和形状的联合分析,提出了一种对上述问题具有鲁棒性的实时条码定位方法。对于普通的网络摄像头,用户只需要在摄像头前放置一个大约15厘米的条形码,然后系统会自动定位和解码条形码。本文只关注自动定位。我们将在会议上现场演示整个系统。关键词:条码、图像处理、本地化。

1 导言

条码技术已广泛应用于提高计算机数据录入的速度和准确性。但目前流行的条形码阅读器是带有激光扫描仪或特殊CCD摄像机的设备,这在我们的日常生活中很少见。如果可以用普通相机(如网络摄像机或手机摄像机)进行条形码读取,条形码将为我们的日常生活带来更多的便利甚至新的体验。

关键问题是在复杂的三维场景中搜索条码并将其提供给读取子系统[2],[3],作为图像分析任务,条码检测在某种意义上比边缘检测[4]简单,因为条码是平行的。它们之间的宽度和间隙是单位条形宽度的倍数。尽管如此,标签读数对标签尺寸、方向和距离等几何效应不敏感[5]。当条码仅占据杂乱图像的一个小区域或图像聚焦不好时,边缘特征的准确性和效率会降低。事实上,边缘交互问题一直是限制当前条码阅读器工作范围的主要因素[6],但是,图像大小和分辨率的简单放大并不有利,因为它需要在更宽的范围内更好地聚焦,需要更多的计算时间。更多的记忆,因此mu更多资源。从这个角度来看,两阶段处理[L],[2],即使用基于区域的低分辨率分析查找条形码。

图像,然后用高分辨率的图像对它们进行聚焦和阅读,是更可取的。

一些研究人员直接利用梯度信息作为条码提取工具[1]、[2]、ando和hontani[1]提出了一种边缘、脊线、角点和顶点的“分类投影后特征提取”方法。但该方法不具有鲁棒性,尤其是在条码位置附近出现多边缘噪声时。

其他人在他们的检测标准[3]、[7]、Jain和Kara[7]中考虑了纹理,在神经网络体系结构中实现了纹理分割算法。对质心和梯度下降两种学习算法的性能进行了评价。由于该方法只考虑纹理,如果图像中出现类似的纹理(如文字和条形),则可能会混淆条码位置。

在许多应用中,纹理和形状是密切相关的[8],单个纹理特征不足以区分图像模式。空间关系描述本身也不能全面、准确地描述图像内容。但是,它可以增强图像内容的描述和识别能力。许多检索方法都使用这种联合信息[9]、[10]、[11]、[12],因此我们联合估计纹理和形状以提高条码定位的效率。

2 条形码位置

通过以上分析,我们的方法采用了两步处理,即首先使用基于区域的低分辨率图像分析找到条形码,然后使用原始图像对条形码进行聚焦和读取。not;

在低分辨率下,第一步是从边缘方向估计主方向,类似于边缘直方图[8],第二步是区域拾取,分别沿条轴和代码轴进行精确的方向计算和代码投影(图1)。

在高分辨率下,在解码前对图像进行条码姿态规则化、有效的零件查找和高光去除等预处理。图2是说明条形码本地化过程主要步骤的示意图。

条形码最显著的特点是它的纹理信息。对比度、粗糙度和方向性是三个主要的统计纹理描述符。条码的主要定位分为四个步骤:图像预处理、方向滤波分割、方向图像开放操作和主方向确定。

图2-1 条形码特征分析

a) 图像预处理这一步的主要任务是去除物体上的阴影,调整图像强度的范围。在这一步中,我们采用了光照补偿技术:1)补偿不均匀光照;2)将图像强度拉伸到0-255。将非均匀光照模型化为一个二阶加性曲面,将其与原始图像分割,得到均匀光照图像。not;not;

b) 在光照补偿图像上分别应用方向滤波和分割四个方向滤波器,得到0、45、90、135角的梯度信息。然后通过迭代分割生成二值梯度图像[13]。分割迭代的终止条件是连续阈值之间的差异小于5个灰度级。此外,最后的阈值乘以一个系数,以得到更薄的边缘。在PC版本中,为了减少背景干扰,采用的系数为0.5;而在PDA版本中,为了在模糊图像中获得更多的边缘,采用的系数为0.7。

c) 方向图像的开放操作在背景复杂的情况下,分割结果仍然包含许多方向相似的孤立边缘。只有条码在一定方向上具有很强的连续性和一致性。使用与方向过滤器方向相同的图像打开操作符,可以很好地去除背景噪声。

d) 主方向估计在这一点上,主方向可以估计比较这四个二进制图像。方向过滤可以在平行于条码的方向和垂直于条码的方向之间产生明显的差异。我们计算每个方向的边数,条形码的主要方向是边数最多的方向。

确定主方向后,利用主方向二值化图像提取出精确的条码区域。条形码的连续性和方向一致性仍然在这里使用。这里有两个步骤:角度计算和垂直和水平投影。

图2-2 条形码本地化框架

2.1 区域拾取

a)下一个投影步骤需要精确的角度计算。角度可以直接从边缘获得。条码在边缘图像中具有高密度。边缘图像以32个像素的间隔向下采样,并通过计算每个局部区域的边缘数生成密度图像(图3-1)。条形码边缘(像素值1)在以最高密度位置中心的圆中搜索。一旦检测到条形码边缘,就会拾取整条线(图3-2)。如果是限定线(长于maxlinelength=25),则从其端点计算角度。这个角度被认为是棒轴方向的表达式。

图2-3 密度图像 图2-4 角度计数

图2-5:Axis ProjG 图2-6 Bar Axis Proj

b)代码轴投影和条轴投影

编码轴投影阵列CP首先是通过计算每个边缘点的编码轴投影得到的。最长的子数组被视为条码位置,其投影条高于代码轴投影直方图中的平均条高。子数组的长度取。

条形码高度bh(图3-3)。在沿码轴的合格点中,通过计算每个边缘点的条轴投影,得到条轴阵列BP。如果杆轴投影杆高于0.1*bh,则视为条码位置。每个条形码位置在两侧延伸偏移(20)像素,以连接相邻的条形码位置。因此,一个条码中的条作为连续子数组链接。由于同一行中可能出现多个条形码(从1到3),因此可能存在多个合格的子数组。最大宽度的子数组位于条码位置。然后,如果宽度大于0.5*bh的其他子阵列位于所定位的条形码旁边,则将它们合并到有效的条形码位置(图3-4)。然后可以获得条形码宽度bw。

2.2 图像处理

如果CEN在拾取的条形码区域内,则本地化结果视为有效结果。从原始图像中切出条形码区域(图4-1)。然后进行进一步的图像处理。后处理包括图像旋转、图像切割和有效的零件查找。镜像图像也可以处理。

a) 条形码旋转角度已在第2.2节中计算。条码区域采用双线性插值旋转。整个条码图像被保留下来,空白区域被镜像投影修复(图4-2)。

b) 条码裁剪原始条码宽度bw和条码高度bh可用于计算条码的最有效区域。当条形码大角度旋转时,它主要被使用。bw*bh尺寸的中心部分被切断(图4-3)。

c) 有效零件发现还有其他因素

这会影响解码精度,例如条形码区域内的数字和突出显示区域。相反,有效的条形码部分代表了垂直方向的高连续性。首先对条码区域进行二值化,以图像平均值TMEAN作为分割阈值。相邻扫描线之间的相关性。按中计算

方程1。有效部分是扫描光束相关性高于平均相关性(fie)的最宽区域。

(1)

图2-7条形码切割 图2-8有效部位

3 实验

测试图像的分辨率为640x480(VGA),在不同的平台上使用不同的摄像头。我们使用的是桌面电脑的Creative网络摄像头、联想的Pocket PC内置摄像头和移动平台的DoPod565智能手机。不同环境下不同质量的图像(图6)的边缘测试如下。

3.1 鲁棒性

a) 复杂的背景设计如图5a所示,条形码总是印在各种产品上。复杂的封面设计,包括文字和图片,增加了计算机读取条形码的难度。

b) 在不同的环境光照条件下,环境光照条码可能会被捕获,这将极大地影响到rantiired barcode imaups ifitj 5h ficr bal中条码和空间的灰度。

(a)(b)9780201616361 0085393785420

图3-1 复杂背景设计(a)和网络摄像头环境照明(b)

c)透视变形:强大的条形码识别系统应允许用户从广泛的角度捕捉条形码图像。透视效果可能会极大地影响识别过程(图6b)。

(a)Pocket PC 948872451628(b)智能手机9787302010593

图3-2 袖珍PC(A)上的环境照明和智能手机(B)上的透视变形

d)通过有效定位、突出显示和嵌入条形码区域,突出显示和嵌入数字。

数字会影响解码效率,因为解码过程取决于条数及其宽度(图7a)。在不消除这种干扰的情况下,不能简单地将条形码区域发送到“条形码识别”模块。“有效零件查找”作为“条码本地化”的最后一步,完成了这项任务。

e)罐或瓶子的盖子上也可能出现曲面条形码。由于它们具有曲面(图7b),因此很难对摄像机进行解码,因为条在不同区域的变形不同。“区域拾取”可以正确地找到弯曲的条码区域,并将其恢复到原来的形状。

图3-3

f)有时多个条形码,多个条形码一起列出。一种是美国标准UPC-A,一种是国际编码RALEEAN13,另一种是价格条码。如果不分离条形码,解码过程将无法产生正确的结果。因此,在“条形码标识”中增加了“预设”和“多条码分离”。很明显,“条形码定位”可以在一张图片中提取所有条形码(图7b)。

3.2 计算时间

我们设计了一个框架并开发了一个系统来实现所提出的条形码读取算法。在我们的框架下,我们可以轻松地为台式机、Pocket PC和智能手机平台构建不同的版本。台式电脑有IntelPentium4 2.40GHz处理器和510MB RAM,带有WindowsXP专业版操作系统。Pocket PC配有PXA272 CPU(312兆赫)和Windows Mobile 2003 SE操作系统。智能手机使用Windows Mobiletrade;2003第2版,其CPU为TI OMAP730(200MHz)。我们在一个功能强大的平台(台式电脑)和一个功能较弱的平台(智能手机)上记录了条形码读取系统的性能,如下所示。

我们的技术报告提供了更多的细节和结果。

表3-1 条形码读取的计算时间

国产化

条形码标识

总时间

台式电脑

MS 62

16 ms

78毫秒

智能手机

1274女士

487女士

1761女士

4 summary

提出了一种自动实时条码定位算法。它包括两个阶段的处理,即首先通过对低分辨率图像的基于区域的分析找到条形码,然后以原始分辨率读取条形码。在各种条件下,对复杂的三维场景进行了大量的实验,取得了很好的效果。未来的工作包括读取严重扭曲的条形码图像。

5 REFERENCES

[1] S.Ando和H.Hontani,“三维场景中条形码的自动视觉搜索和读取”,车辆电子会议,Proc.IEEE第49-54页,2001年9月

[2] S.-C.J.Li、J.Xu和T.Pavlidis,“基于窗口的条形码采集系统”,Proc.SPIE,第2181卷,第125-132页,1994年。

[3] 廖海勇,刘世杰,陈立华,泰安,“基于反向传播神经网络的条码识别系统”,人工智能工程应用,第8卷,第1期,第81-90页,1995年。

[4] M.Heath,S.Sarkar,T.Sanocki和K.Bowyer,“比较边缘探测器:方法论和初步研究,“计算机。视觉、图形、图像理解,第69卷,第1期,第38-54页,1998年。”

[5] R.Boie和W.Turin,“条形码的噪音限制读数”IEEE Trime.工业电子,第IE-44卷,第6期,第816-824页,1997年。

[6] E.Joseph和T.Pavlidis,“使用峰值位置的条形码波形识别”,IEEE Trans.模式肛门。《机器集成》,第PAMI-16卷,第6期,第630-640页,1994年。

[7] A.K.Jain和K.Kara,“学习纹理识别面具”,IEEE Trans.模式分析和机器智能,第18卷,第2期,第195-205页,1996年2月。

[8] N.Takahashi,M.Iwasaki,T.Kimieda,et al.,“利用空间强度特征的图像检索”,信号处理:图像通信,16(1

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[18693],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。