节点文献

数字图书馆中数据预处理子系统的设计与实现

【作者】 田艳芳

【导师】 邓胜兰;

【作者基本信息】 国防科学技术大学 , 计算机科学与技术, 2001, 硕士

【摘要】 计算机网络的飞速发展为信息的传播与检索提供了技术基础。但是,由于当前需要存储和传播的信息量越来越大,信息的种类和形式越来越丰富,信息更新的速度也越来越快,现有的资源管理和应用模式已经远远不能满足用户的要求了。而数字图书馆作为新一代因特网上信息资源的管理模式,已成为高性能网络信息技术的研究热点之一。 由于现有的数字图书馆软件平台不能很好的完成数据入库以前的一些基本工作,所以,本文对数据的预处理工作,作了详细的设计和实现。首先介绍了数字图书馆的研究背景,数字图书馆的整体结构和数据预处理子系统的结构;然后详细阐述了数据预处理子系统中各个模块使用的技术,以及它们的实现。其中关键的技术是:分类标准的确定;智能分类技术的研究和实现;元数据的确定;文本、图像和元数据的提取;XML技术在数字图书馆中的应用;自动入库功能的实现。

【Abstract】 The rapid increase of computer network provided a technical foundation for the spread and search of information. But,because of the more and more information need to be spread,the more enrich kind and form of information,the more rapid speed of information updating,the existing management and application pattern of resource can no longer meet the needs. But,digital library,as a new management model of information resource in internet,has become one of the research focuses of high performance information technology in the network.The existing digital library software cannot accomplish the basic preceding work for storing data to DBs. Therefore,this paper designed and implemented the work of data pretreatment. First,the research background,the whole structure of digital library,and the structure of pretreatment subsystem are introduced. Then,the techniques and implement of each module in data pretreatment subsystem are presented. The key techniques include,standard of classifying is confirmed,research and implement of intelligent classification technique,metadata is confirmed,text,image,and metadata are distilled,the technique of XML is applied to digital library,the function of storing data to DBs is implemented.

  • 【分类号】TP399
  • 【被引频次】4
  • 【下载频次】188
节点文献中: 

本文链接的文献网络图示:

本文的引文网络