国家卫生数据字典
(初稿)
卫生部统计信息中心
第四军医大学卫生信息研究所
目 录
一、字典结构 1
1.元数据标识符 3
2.数据元表示形式 4
3.数据类型 4
4.数据格式 5
5.基本属性描述 5
二、字典内容 7
附录1 数据元条目(278个) 8
附录2 代码条目(85个) 28
附录3 大型代码表(20个) 35
附录4 词汇表条目(6个) 60
附录5 数据字典应用实例-医院出院病人数据库结构 63
国家卫生数据字典(National Health Data Dictionary, NHDD)即元数据资源库(Meta Data Repository),目的是为使用者提供数据元和描述数据元的元数据,是卫生信息系统和数据库建设必须遵循的行业标准。
一、字典结构
根据元数据注册国际标准,国家卫生数据字典具有8个基本结构,见图1,其中最基本的结构是对象类、特性、表示。
对象类:现实世界中的想法、抽象概念或事物的集合,有清楚的边界和含义,并且特性和其行为遵循同样的规则,能够加以识别和标识;
特性:对象类的所有个体所共有的某种性质;
表示:值域与数据类型的组合,必要时也包括度量单位或字符集。值域是数据元允许(或有效)值的集合。比如,表示医生年龄的数据元可以用一个非负整数集(实际年龄,以年为单位)作为有效值集。另一种选择是,把有效值用事先指定的类别清单表示,且每个类别都具有一个代码值,如代码值1(< 35岁),2(36~ 50岁),3(51~ 65岁),4(>65岁)。前者的值域是一个非穷举域,后者的值域是一个穷举域。穷举域通常用编码系统表示,如ICD-10编码。ICD-10编码是值域的一种分类模式。
数据集和术语(词表)是国家卫生数据字典的附属结构。数据集有两个主要作用,一是用来表示需要用多个数据元表示的事务,如人的姓名的完全表示包括当前姓名、昵称、化名、笔名、中文名、外文名、曾用名、曾用名使用时间、曾用名停用时间等;二是用来规范国家最小数据集,如出生登记最小数据集、死亡报告最小数据集等。术语(词表)是供所有元数据条目参照、引用的规范词汇。
对象类是我们希望用于收集和存储数据的事物。对象类的例子有病人、医生、护士和化验单等。特性用来区别和描述对象的特征,如肤色、姓名、性别、年龄、职业、收入、住址等。另外,特性有可能需要用多个词组加以描述,这要视所用的自然语言而定。对象类和特性的组合称为数据元概念(DEC)。数据元概念是能以数据元形式表示的概念,其描述不包括任何具体的表示。例如 “医生年龄”就是对象类+特性构成的一个数据元概念,对应了两种表示:实际年龄或年龄组。因此,数据元的构成可表达为:
|
|