基于DeepSee的医院药库数据挖掘
虞海燕①,李劲松①,曹淑真①,韩雄②
①浙江大学数字化医疗工程研究中心,310027,杭州市浙大路38 号
②南京军区卫生部信息中心,,
摘 要 医院的信息统计工作是医院经营管理的重要组成部分,而医疗行业数据关系具有其
复杂性和特殊性,这决定了对数据处理的繁杂性。本文利用嵌入式实时挖掘工具DeepSee
对医院HIS 数据库中的数据进行处理,以药库为主题建立模型,从出库趋势、库存量、库
存单位盈利和厂商盈利四方面进行挖掘分析,为医院管理者提供管理和经营决策支持。
关键词 数据挖掘 DeepSee HIS 数据库 药库
1 引言
HIS 数据库包括了医院所有的与收费有关的医疗活动,如各种检查、化验、
医治、用药、护理以及床位、耗材等纪录。因此数据挖掘在医院信息系统中的应
用主题是多方面的。HIS 数据库中存储了各种临床和管理信息,这些都可通过数
据挖掘,提供决策支持。
药库作为医院药品的主要贮备场所和供应基地,对于保证医院用药安全、有
效和充足,起着举足轻重的作用;药品收支核算的正确与否直接影响着医院的经
营成果,因而加强药品的进、销、存各环节的财务管理,对提高医院的经济效益,
促进医院稳定发展具有重要意义。本文使用数据挖掘方法对医院HIS 数据库中的
药品数据进行统计分析,为药剂部门乃至医院管理层提供决策支持。
2 材料和方法
2.1 挖掘理论 医疗行业有大量数据需要处理,但由于不同的信息系统管理中数
据以不同的格式保存,数据在总体上是无组织的。因此,医疗数据挖掘最关键的
任务是进行数据清理,然后对预处理过的数据进行转换,寻找有用的特征表示依
赖于任务目标的数据。整个挖掘过程也不是简单的线性流程,可能包括了有效的
迭代,在任两个步骤之间都有可能有循环。这样可以对所挖掘的知识不断求精、
深化,并使其易于理解[1]。
传统的数据挖掘分析过程分为数据选取、预处理、数据转换、对数据模型进
行挖掘和评价,本文使用InterSystems 公司的BI 工具DeepSee 对医院HIS 数据
进行挖掘分析(图1)。DeepSee 相对传统数据挖掘工具的特点是嵌入式实时挖掘,
能够随时对医院信息系统中的海量医疗数据进行实时处理,生成报表并统计分
析,为医院经营者提供管理、经济和临床等多方面的信息和报表,为领导决策和
临床医疗决策提供支持 [2-3]。
Embedded Real_Time
Data Minining
doctors
managers
HIS
Data base
application
knowledge
data miner
decision-making support
guideline
图1 嵌入式实时挖掘过程
2.2 挖掘实例 首先,根据分析主题确定维度、相关指标和数据来源。本文以药
库为模型,对浙江省某医院2001 年至2005 年间的HIS 数据进行挖掘分析。根据
药库主题确定维度和数据来源等(见表1)。
表1 以药库为主题的维度表
主题 药库分析
维度 日期维(时间段,日,周,月,季,年)
相关指标 药品名称,库存单位名称,期末库存量,出库药品出入盈亏,库金额,
厂商
数据集及
数据来源
(概要)
药品字典:DRUG_DICT
药品供应商目录:DRUG_SUPPLIER_CATALOG
药品结转记录:DRUG_STOCK_BALANCE
药品库存单位字典:DRUG_STORAGE_DEPT
数据详细 药品名称:drugfk.DRUGNAME
药品代码:drugfk.DRUGCODE
出库金额:EXPORTMONEY
期末库存数量:INVENTORY
出库药品出入盈亏:PROFIT
出库单位名称:STORAGE.STORAGENAME
厂商:FIRMID.SUPPLIER
时间:YEARMONTH
(其中drugfk 为DRUG_CODE 和DRUG_SPEC 的foreign key)
在数据库系统中根据数据 |
|