运用多维度交叉索引技术分析病案首页数据
余元龙① 苏韶生① 程敏婷① 张淑娟①
①中山市人民医院医院,528400,广东省中山市孙文中路2号
摘 要 本文阐述了传统病案首页统计分析的不足,介绍一种运用多维度交叉索引技术分析病案首页数据的方法,详细总结用这种技术分析病案首页数据能够为医院决策管理提供深度化和广度化信息支持。
关键词 交叉索引 多维度数据分析 病案首页 病种管理 联机分析处理
1 前言
病案首页浓缩了整份病案中的重要内容,涵盖了多种医疗信息内容,对医疗统计、治疗量服务、医疗质量评估、临床科研、医疗事故鉴定、患者评残、医疗保险、计划生育及医疗成本核算等项内容都具有重要价值[1]。
传统的病案首页数据分析都是基于二维表数据的联机事务处理(On-Line Transaction Processing,OLTP),这种方式仅能满足用户对数据库查询检索的简单需要,而统计部门的联机分析处理需要对分散在多个事务处理应用中的相关数据、指标进行集成,但由于事务处理应用的分散性、多态性、多个应用间数据的不一致问题 ,使目前以事务处理为主体的OLTP难以满足分析型处理和决策支持对数据在时间空间上的广度和深度的需求,因此本文介绍一种利用多维度交叉索引技术分析病案首页数据的方法。
2 相关概念及技术
2.1 联机分析处理 联机分析处理(On-Line Analysis Processing,OLAP)最早是由关系数据库之父E.F.Codd于1993年提出的,联机分析处理是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。决策数据是多维数据,多维数据就是决策的主要内容。OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状
况,了解对象的需求,制定正确的方案[2]。
2.2 交叉索引技术 交叉索引(crossing-index)技术是由Frederick A.Powers于1995年主导发明,应用在数据模型的建立中,通过对数据的自由交叉索引处理,实现任意“维”之间的关联和潜入来获取最需要的信息,也是通常说的多维度交叉分析。
该技术可以在来自于不用类型数据源的数据之间自由交叉,通过建模之后,用户获得了有效的处理信息。模型中包含了3个数据域:维 、摘要和信息字段。建模中被定义成维的字段是被做经过交叉索引处理的,可以对任意维和维之间相互快速的潜入来获取我们最需要的信息。数据中用来做数学统计的字段被定义成摘要。信息字段包含了和维相关的额外信息。
3 系统设计
3.1 建立维度 将病案首页数据中所有的字段作为可分析的“维度”,在模型中成为直接点击就能看到数据信息的分析角度。维度可以相互任意交叉分析,从而也就是多角度地看问题、聚焦问题,当发现一个问题时依然可以多层次的潜入,找寻到问题根源。
3.2 建立指标模型 将医院关注的与医疗质量管理有关的指标抽取,形成一套丰富的指标集合在模型中。对关键指标,可以实时监控,观测指标的变化,也可以了解某个指标在一段时间的趋势走势。当指标出现异常或需要了解更细节的原因时,可以通过不同维度聚焦或潜入分析。通过这样的分析,所有指标从静止的数值变成动态的、可分析、可挖掘的信息
4 实施步骤
4.1 数据抽取、转换和加载(ETL) 使用ETL工具将数据从病案首页管理系统中抽取、清洗、整合和传送。
4.2 建立数据模型 使用建模工具将清洗整合好的数据建立模型,分成多维度可以分析的模型集合。
4.3 建立分析维度 对模型进行必要的分割或关联整合,设计模型的增量,逐步完善模型集,形成数据集。
4.4 应用展示 通过客户段的分析挖掘工具,来 |
|