存储架构
8.1
存储需求分析
基于健康档案的区域卫生信息平台建设中最关键的是数据。如何满足区域卫生信息平台的存储需求,是我们必须考虑的问题。以下我们对区域卫生信息平台中所涉及的存储需求进行分析。
8.1.1
存储的数据类型
在存储架构的设计中,我们需要同时考虑健康档案的数据存储和区域卫生信息平台的数据存储。
健康档案的存储主要分成五种类型:健康档案数据存储(EHR Data Storage)、业务文档数据存储(Business Document Storage)、ODS数据存储(Operational Data Store)、业务平台数据存储(Business Data Storage)、数据仓库存储(Data Warehouse)。
区域卫生信息平台运行所涉及的支撑数据包括:标准数据、注册数据、来自各POS的数据等。
1)、健康档案数据
健康档案数据(EHR Data Store)是区域卫生信息平台的基础。健康档案数据不限定以关系型数据库或文档的存储方式进行存储,在存储架构设计中应重点考虑健康档案数据中不同数据存储方式下的存储、归档、检索的效率,以及所涉及的数据备份恢复。
根据健康档案信息的分类,健康档案存储服务分为七个存储库:个人基本信息存储库、主要疾病和健康问题摘要存储库、儿童保健存储库、妇女保健存储库、疾病控制存储库、疾病管理存储库以及医疗服务存储库。
2)、业务文档数据库
业务文档数据库指的是医疗活动产生的与EHR相关的文档,这些文档通过区域信息交换层(HIAL)传送到区域卫生信息平台。它需要平台的专门服务解析和
670
映射(Parser/Map/Rebuilder),才能转换成EHR文档。平台必须有一个永久存储业务文档库的数据库。
业务文档以XML方式进行组织,与电子签名相结合,在文档库中进行注册。
3)、ODS数据库
从业务支持的角度来看,我们需要建立ODS数据库,来实现对业务的更好支持。为了完成某些特定业务上的流程要求,可能产生很多中间数据,而这些中间数据都有赖ODS数据库实现其存储方式。
4)、业务平台数据库
除健康档案数据(EHR Data Store)之外,区域卫生信息平台需要存储一些相关的业务数据,并实现对这些数据的插入、更新、查询和统计功能。业务数据主要包括以文档形式存储的结果数据,以及操作型数据。
文档数据:以文档形式存在于平台中的临床和预防保健业务数据,例如检验报告、处方、传染病报告卡等。这些数据是结果数据。
操作型数据:从多个医疗机构内部信息系统中采集上来,并加以汇总处理后的数据,主要服务于统一的实时查询和实时的统计。
5)、数据仓库
主要是业务管理和辅助决策所需的支撑数据。这些数据是通过数据仓库工具进行抽取、转化和整理后存储在数据仓库中的。数据仓库数据以主题方式组织,是经过二次加工的历史数据。
6)、标准数据
标准数据是区域卫生信息平台运行的数据基础。标准数据包括区域卫生业务数据的所有数据标准规范,通过这个库和数据校验机制对数据中心的数据进行标准化保障,主要的数据标准包括整个定义电子健康档案的数据集和数据元(具体可参考卫生部发布的中国健康档案数据标准),还有各种代码标准。由于数据标准存在着时效性,因此针对有时效性的数据进行版本控制,不同的版本有各自的生命周期,不同生命周期中的业务数据对应不同版本的数据。
在系统实现中,标准数据以XML template的形式或关系型数据的形式进行存储。
7)、注册数据
注册数据是满足注册服务所需的数据及存储。包括个人、医疗卫生人员、医疗
671
卫生机构、医疗卫生术语的注册管理数据。
8)、区域信息交换层(HIAL)临时存储的交换数据
区域信息交换层(HIAL)将来自于POS的数据/文档接入到平台中进行处理。区域信息交换层(HIAL)将EHR数据/文档发送到POS或其他数据消费方。这些数据/文档在处理前将临时存放在数据交换(HIAL)应用服务器或其他服务器。这部分数据的存储要求有较高的I/O速度。
8.1.2
数据存储的模式需求
对于基于健康档案的区域卫生信息平台来说,数据存储模式是信息架构要考虑的一项重要内容。对于区域卫生信息的使用者而言,没有必要关心数据的存储模式。这比如大家从互联网上查找新闻时,大家并不关心存储这条新闻的服务器放在那个国家,也即不必关心数据存储模式。但是区域卫生信息平台的设计者,需要从经济可行性、技术可行性和管理可行性方面去考虑选择不同的数据存储模式。
区域卫生信息平台涉及到与居民健康相关的所有业务,因此其业务数据具有类型多、容量大的特点。数据存储模式种类有以下三种:集中式、分布式和联邦式。集中式:建设一个统一的数据中心,把一个区域内需要共享的数据集中全部存储在数据中心。分布式:一个区域内没有统一的数据存储中心,数据可以分散在不同的机构和地点。例如,某个患者需要访问上个月做的X光检查资料,区域卫生信息平台会将该患者的访问需求转移到他上个月去的医院的系统,将存储在该医院的数据提供给患者使用。所谓联邦式是集中与分布相结合的数据存储模式,对于用户经常访问的数据集中在数据中心,其余分散在不同地点或机构。
根据业务数据的特点,对数据存储的要求也不尽相同。我们对这三种数据存储的优劣势以及数据分布的分析如下:
表8-1 数据存储的优劣势以及数据分布
数据存储模式
优点
缺点
数据分布
集中式存储方式
效率高且方法简单
但扩展性和灵活适应性受到一定局限
在本系统建设中,对于居民基本信息(包括姓名、性别、出生年月、身份证号、社会保险号等),由于其使用频率高,数据容量相对较小,可采用数据中心集中式存储的
672
方式;对于公共卫生信息,如疾病预防数据、妇幼保健数据、精神卫生数据,则采用中心集中存储的模式,这样可以保证该类数据的安全性。
分布式存储方式
一般说来效率较低,技术实现复杂
扩展性和灵活性有很大优势
在本系统建设中,对于医学影像信息,其数据量大,可采用分布式的存储模式,这类信息通过注册到区域卫生信息平台,当医疗机构需要调阅时,可通过平台查询获取数据所存储的地址(一般为某医疗机构),再从目的地获取所需要的信息。这样既减轻了平台的负载,也提高了数据的调阅效率,但缺点是对医疗机构之间的网络要求较高,区域范围内各医疗机构之间必须是双向网络,而且需要保证一定的带宽。
混合存储方式(联邦式)
结合以上两种模式的优点
对于其他业务数据(如实验室检验数据、就诊记录数据),则可以根据实际的业务需求,采用分布式存储+集中式存储的混合模式。
总的来说,区域卫生信息平台存储架构设计中应考虑支持这三种架构来实现数据存储。
8.1.3
数据存储的安全需求
在存储设计中,应考虑数据存储的安全需求。由于数据不限定以关系型数据库或文档形式进行存储,需要建立安全控制机制,对存储的数据对象访问进行授权。对于存储在数据库中的数据,除了授权机制之外,应考虑视图级安全和记录级安
673
全控 |
|