

Research on Data Warehouse System of Virus Medicine

【作者】 宋广磊

【导师】 吕立; 李喜旺;

【作者基本信息】 中国科学院研究生院(沈阳计算技术研究所) , 计算机软件与理论, 2008, 硕士

【摘要】 中医理论的发展源远流长,如何充分利用其间积累的大量中医文献资料,为医学理论的进一步探讨提供支持成为目前亟需解决的重大问题。计算机技术的发展,特别是数据仓库、OLAP和数据挖掘理论与技术的发展,为决策支持提供了强有力的技术基础保障,实现了将信息转化为数据,利用数据发掘出知识。因此,如何充分利用这些理论与技术为中医理论的发展提供支持,将文献资料信息转换成规范化数据,建立数据多维立方体,对其进行多角度、多层次的分析和数据挖掘完成对特定中医理论的论证成为亟需探讨的课题。本文围绕中医毒热数据仓库系统的设计和构建,实现对毒热为胃脘病等常见疾病的主要病因且总体治法为清热解毒、消痈生肌这一推断的论证提供支持这一中心阐述对数据仓库体系结构的研究,包括数据仓库体系结构,元数据的作用与整建,数据仓库概念模型、逻辑模型、物理模型的设计与实现。数据仓库开发方法的研究,利用RUP即统一开发过程实现数据仓库的增量迭代开发,设计与实现保证数据质量的流程,数据仓库数据总线结构的设计与开发。数据仓库应用的研究,包括OLAP,即在线联机分析;数据挖掘;OLAM,即在线联机挖掘等等。根据上述理论和开发技术,参照在医学领域应用成功的数据仓库与数据挖掘相关项目,深入问题领域应用建模方法,针对中医毒热文献特定的复杂的数据格式和数据类型,完成了将中医毒热文献信息转化为关系数据库中的规范化数据,充分利用关系数据库对数据管理的强大功能进行数据清洗和转换。同时,利用开源ETL工具,构建强健、可重用的ETL过程组件,实现了关系数据向多维数据的提取、转换、加载。本文还利用数据仓库数据总线技术进行主题划分,完成了各个数据集市的多维数据立方体的构建;通过实现Mondrian和Tomcat的良好集成构建了基于Web的OLAP平台,在此基础上为满足用户需求设计实现了相应的OLAP业务分析功能;同时,将OLAP业务功能模块与Web层其它功能模块相结合实现了一个完整的数据仓库应用原型系统。在数据仓库设计开发的各个层次各个阶段充分保证了数据仓库的数据质量,特别是利用RUP开发方法构建中医毒热数据仓库系统,充分利用了其增量迭代开发和风险控制的特点极大改进了数据仓库系统的构建。通过实践证明,本文建立的原型模型是可行的,并且取得较好的效果。

【Abstract】 How to use the theory materials of Chinese traditional medicine which accumulated in its long history to assist its development is an urgent issue. Recently, the development of computer science, especially Data warehouse, OLAP and Data Mining, realizes the processes of conversion from information to data and of mining knowledge from data very well. So how to apply these theories and technologies to support and assist the development of Chinese traditional medicine, through the processes containing the converting the materials to the typical data, developing the data cube, taking multi-dimensions、multi-levels analysis and data mining to finish the demonstration of special medicine theory is the urgent issue to be resolved.This paper around the design and build of Data warehouse of Virus Medicine system discusses the research about data warehouse hierarchy, the function and normalization of metadata and data model and the research about develop methods mainly contains the realization of RUP and how to assure the quality of data. The applications mainly contain OLAP, Data Ming and OLAM.Combine above technologies and the system goals, this paper realizes the assignments as follow: converting information to regular data, develop robust and reusable ETL processes.Through data warehouse data bus to determine every topic, design and realize the data cubes. Integrating Mondrian with Tomcat configures the OLAP platform based Web and realizes the OLAP functions to satisfy user’s requirements, assure the data quality of every stages, every levels of data warehouse building. Especially, this paper effectively applies the RUP for the designment of the data warehouse system about virus medicine, so greatly improved the designments and implement of data warehouse system. The prototype models are right verified by practices.

【关键词】 数据仓库RUPOLAP数据挖掘
【Key words】 Data warehouseOLAPRUPData mining
  • 【分类号】TP311.13
  • 【被引频次】1
  • 【下载频次】112

