节点文献

基于顶点链编码的表格图像分析

Analysis of Form Image Based on Vertex Chain Code

【作者】 李国强

【导师】 顾国庆;

【作者基本信息】 华东师范大学 , 系统分析与集成, 2004, 硕士

【摘要】 顶点链编码是数字图像处理领域非常重要的工具。链编码的优点是十分明显的。它把二维图像的存储和处理变为一维链上的问题。对于大尺度的图像,链编码可以大幅度地节省存储空间并提高处理速度。该算法对推动顶点链编码在图像处理领域的应用,起到了重要作用。 表格文档分析与识别是计算机文档处理中的一个重要项目。表格是文档中常用的数据资料载体,因而表格图像分析技术的研究具有很大的潜在的应用价值。本文基于顶点链编码技术,提出了一种新的表格图像分析算法,并发展了一种自定义的表格文件格式,对丰富表格文档的分析手段,减小表格图像的存储空间都有很大的作用。 由于在用扫描仪和数字照相机获得表格文档时,倾斜总是难免的,因此表格图像的倾斜探测和矫正是表格图像分析的第一步,也是表格分析及以后各项识别工作准确性的保证。物体在数字图像中占据的面积在图像分析和识别中具有重要的作用。通常采用的方法是积分法,但对于各种极其复杂的图像形状,该算法不一定适用。因此,人们对具体对象研究了不少其他算法。但是这些算法普遍存在的问题就是运算量较大,计算时间长。 本文针对这两个问题,提出了新的算法。首先,根据表格图像中,表格的框线或悬线具有最长的边界,以及边界标定自动机能获得区域边界的优点,提出了一种新的表格图像文件倾斜矫正的方法。该方法使用简便,而且在大噪声的背景下也能使用。其次,提出直接从顶点链编码计算封闭边界所围区域的面积的方法,对于正方形、正三边形和正六边形点阵上的图形,都有直接从链编码计算区域面积的方法。最后,通过实验证明了两个算法的有效性。 本文在研究算法的同时,在windows平台下,使用Visual C斗¨}编程工具,对涉及的算法进行了系统开发和实现。

【Abstract】 The form recognition is important in document processing by computer. We often take the forms as the carriers of data and information, so there is great potential value in the research of the form analysis and form recognition. Based on the Vertex Chain Code, in this paper, we propose a new algorithm for form-analysis and develop a new format of form file, which is very important for form analysis and saving considerable memory space for form image.When we get image from scanner or digital camera, the image is often skew, so skew detection and skew correction of images for text documents and form documents is the first step for optical character recognition and form analysis. The areas of objects in digital images play an important role in image analysis and pattern recognition. We usual use the method of integral, but for some complicated images and figures, the method may not work well. So many algorithms have proposed to solve this question. But there are some universal problems in these algorithms, for example, long time of calculation.To solve the two questions mentioned above, our group propose two new algorithms, which have been validated by test. One is the skew detection and skew correction of images. The other is the calculation of area of object in digital image.While researching algorithms, we use the Visual C++ developing tool to accomplish the related algorithms on the Windows platform.

  • 【分类号】TP391.41
  • 【被引频次】4
  • 【下载频次】79
节点文献中: