俞国培① 包小源① 黄新霆② 刘徽① 许蓓蓓① 于娜① 张俊①
① 北京大学医学信息学中心
② 北大医疗信息技术有限公司
摘 要 本文从数据角度描述讨论了医疗健康大数据。按照不同来源医疗健康大数据可以分成医院医疗大数据、区域服务平台医疗健康大数据 、疾病监测大数据、自我量化大数据、网络大数据和生物大数据等六大类。这些不同种类数据具有不同的性质、医学价值及问题。
关键词 医疗健康 大数据 数据类型 数据可利用性
中国与西方发达国家一样,正在步入医疗健康大数据时代,现在,每时每刻都有大量新的有关疾病、医疗和健康的信息在产生和流动,并储存于某个地方,等待着被挖掘、分析和应用。由于中国是接近于14亿人口的大国,人数占全世界总人数的1/5,所以产生积累的医学数据量,世界各国无法比拟。截止2013年11月底,全国医疗机构总数为96.2万个(其中医院为2.4万个,其他医疗机构为92.3万个),2012年全国诊疗人数达69亿人次[1]。目前,中国的互联网上也正在实时产生大量难以计数的关于疾病和健康的信息。特有的巨量医疗和健康数据,赋予了中国一个能接触并深入了解更多疾病、诊疗和健康信息的好机会,但同时也给数据使用者带来了更严峻的应用挑战。 |
|