结构化数据输入的新研究
*A.M. van Ginneken, *M. de Wilde
**包含飞(摘译)
*荷兰,鹿特丹, Erasmus大学,医学信息学教研室
**上海中医药大学,中医学信息化-标准化研究室
摘要 本文描述了结构化数据输入(SDE)的哲学思考,知识模型和知识编辑器、概念库,和SDE的功能、模板、有效性检查等有关技术及其界面,最后讨论用户个性化和介绍了当前的发展现状。
关键词 电子病历 医学信息学 知识工程 标准化
(一) 结构化输入:一个悖论
传统的结构化数据输入(SDE)方法是纸张表格式的。人们为这种传统方式开发了电子版,并提供输入检查,检查数字数据的有效性和提高数据的完整性等先进功能。但这种固定排版表格在较小的学科领域,数据需求比较固定和简单的部门是有效的。对较大的学科,及信息需求多变难以预测的部门,固定格式就成为累赘。内科和儿科是典型的那种学科。需要几十个甚至几百个表格,有的病人还需不同的一组次级表格。而且一般还缺乏通览的功能,用户只能看到在显的表格。除了用户方面的不便以外,维护和适应用户问题也非常困难。由于格式刻板,固定不变,覆盖面小,故一般用于数据类型较少,按常规收集数据的部门或研究项目中。需附加的数据则仍用自由文本输入。
一些程序采取较为动态的方式并提供有限的控制词汇库(controlled vocabularies),以菜单或一组模板(template)的形式提供预定义的描述性选项(predefined descriptive options)。所谓动态是指所提供的描述体征和症状的选项对应于当前正在处理的问题。如 PEN&PAD, IMR-E, Ivory, Pure MD, Purkinje, 和A.M. van Ginneken等开发的内分泌学病历系统的原型。这些系统所覆盖的领域范围和内容的详尽程度不同:一些系统用概念-属性-值(concept–attribute–value)模型,而补充的细节(additional detail)以自由文本的方式输入。IMR-E提供的模板的基础是一些经选择的症状。Purkinje则用树状层次结构,可根据要求的详尽程度逐级扩展。固定格式和动态程序的优缺点可归结如下,前者方便快速数据输入,但过分受限于内容范围;后者可变性较大,信息量较大的数据所需浏览量(nevigation)太大,用户的”选择-决定”的工作量过大;
总之,悖论在于医生希望在一个表中能输入任何数据。所以问题的实质是有效性必以牺牲可变性为代价,而可变性将会牺牲有效性,二者能否统一?
(二) 哲学思考
我们的哲学是电子病历(CPR)应有公共基本数据结构但同时其覆盖内容可根据需要“量体裁衣”。公共结构应与专业无关,即描述数据的属性对所有专业是统一的。如实验室报告应包括检验类型、结果值、单位、正常值范围。例如对于血糖浓度测定的报告,无论是外科医生还是内科医生申请均无差别。又例如,药物处方均有药名、剂量和每天用药次数等项目。与临床专业无关的数据用直接模型:屏幕上的字段与表中的属性一一对应的直接关系。这种直接模型比较简单但也较呆板:内容的任何改变都要求数据库和软件作相应的修改。因此,数据变化很少的专业可首选这种直接模型。
有些数据是专业依赖性的,也即不同的专科应用不同的数据项,如心脏科的病历与矫形外科的病历大相径庭。当前症状记录,物理检查,放射科报告,内分泌科报告,病理报告等也是如此。但为了内容的可适性(flexibility),基本结构应是非内容依赖性的。我们选择树状结构,不仅能表达病人数据,而且能表达任何描述性信息。每个结点表示一个概念,其子树则表示其描述。然而,树状数据模型并不反映‘父子系列’的抽象内容。每个结点所指的概念必需“告以”解释这种内容。因为附加了这一解释步骤,所以称其为间接模型。间接模型的可适性的关键是内容的可扩展性和不断发展性且无须改变数据库和软件。
图 1. 间接模型.知识库和病人数据库的内容更新无须更新程序
ORCA(Open Record for CAre)是兼有专业独立性和非独立性数据并以直接和非直接数据模型实现的通用CPR的原型。该程序的采集结构化数据的非直接部分的用户界面是动态的,但直觉性和高效性欠缺。高效性和可适应性的结合是一个严峻的挑战,因此我们把研究重点放在专业依赖性数据的SDE上。这一SDE是全新的设计模块,在数据录入时利用知识库指导。以下介绍此SDE的知识模型,知识编辑器及用户界面。
|
|