节点文献

智能型表格自动识别、还原与生成的实现研究

A Research of Auto Brainpower Form Processing and Recognition

【作者】 黄瀚敏

【导师】 汪瑞芳;

【作者基本信息】 重庆大学 , 控制理论与工程, 2003, 硕士

【摘要】 本文在分析神经网络理论和图象处理及其特征提取理论的基础上,设计并实现了一种基于和经网络与特征提取相结合的表格自动识别及还原技术。对于表格线的提取、识别、还原与生成及字符自动化处理录入技术进行了深入的讨论,并通过实践证明了这是一门既有理论研究意义又有实用价值的新技术。 本文对人工神经网络理论进行了研究,探讨了网络形式及算法的选择、算法的实现、学习样本的收集、网络参数选择、BP算法缺陷、表格线提取、还原、生成及字符识别、还原生成等问题,并针对BP算法的缺陷提出了和实现了改进型BP算法,使网络学习效率提高,对不同人的不同字型字体有较强的鲁棒性,采用了基于链码特征和凹凸分布特征的方法来抽取字符特征。使用了建立奇异特征库的方法,较好地解决了部分特征不收敛的问题,提高神经网络的学习效率和分类能力。并在算法实现中运用了面向对象的方法,保证了大型系统软件的易维护性。西南计算机公司采用了以上算法,实用中获得了满意的效果,证明了该方法的有效性。

【Abstract】 In this paper, a way about processing form based on artificial neural network, digital image processing, and features extraction theory having been designed. The way of auto form extraction and processing having been affirmed is a very valuable technique.The disquisition includes choice of algorithm, accomplish of algorithm, collection of learning sample, parameter of net, shortcoming of BP algorithm, extraction and reduction form line etc. Referring to shortcoming of traditional BP algorithm, a modified learning factor with adaptation is introduced. Because of every different font has robust, the way based chain coded and knaggy feature is used. A bizarre sample feature database is constructed for speeding up modified BP learning and classification. This algorithm is used by South Computer Company, the good result is gotten. The ideal is approved reasonable.

  • 【网络出版投稿人】 重庆大学
  • 【网络出版年期】2004年 01期
  • 【分类号】TP391.4
  • 【被引频次】2
  • 【下载频次】92
节点文献中: