首页 >活动
链接现象与数据,“大数据与人工智能的重症领域应用”
发布时间:2019/03/26

近年来,基于重症大数据的研究极大推动了重症医学在诸多领域的飞速进步。重症医学作为医学领域目前发展最为迅速的专业之一,本身具有医疗数据极其丰富的特点。未来,基于重症大数据驱动的临床诊疗模式及人工智能的发展必将成为重症医学重要的发展方向。

临床中如何快速识别、早期发现重症患者,对于赢得时间,明确诊断,进而早期给以重症患者干预治疗非常重要。临床判断主要依据一般状况和生命体征,采集病史和查体需要同时进行。“现象”和“数据”在过程中尤为重要。2019年3月22-23日,由中国卫生信息与健康医疗大数据学会主办,北京协和医院承办的“首届中国重症大数据与人工智能学术大会暨重症医学分会、标准委员会成立大会”顺利闭幕。

首届重症大数据与人工智能学术大会在京举行

本次大会的主题是“现象.数据”。如何正确理解和解读看似简单的临床现象,准确获得重症患者的数据,探寻现象与数据间的联系,研究现象与数据背后蕴含的意义,是重症大数据工作最重要的基础。

探讨一:医疗大数据隐私保护及标准化

3月21日,国家卫健委信息化质控与智慧医院建设工作的新闻发布会指出:数据和信息安全一方面是涉及到隐私保护,另一方面现在形成的这些大数据资源也是国家战略资源,涉及到国家的生物安全、国家安全。电子病历信息化作为智慧医院的基础,做好数据安全管理将是不可忽视的一部分。

首届重症大数据与人工智能学术大会在京举行

印第安纳大学信息计算与工程学院的王爽博士首先发表了自己的观点:医疗大数据面临的隐私挑战主要体现在医院、药厂、科研机构三方在对数据进行分析挖掘时的“分享“过程。基于此,应该给予政策和技术两个层面的应对策略。

政策层面:王博士分析了我国、美国及欧盟在数据政策层面的情况。1995年,欧盟最早提出了“数据保护指令”政策,美国随后在1996年提出了HIPAA法案(医疗电子交换法案)。而我国在2017、2018年提出了《中华人民共和国网络安全法》、《信息安全技术个人信息去标识化指南》及《信息安全技术个人信息安全规范》,进一步加强了对于信息安全和数据隐私的规范。

目前国内部分公司的数据操作人员通过了美国HIPAA法案,该法案禁止未经患者本人授权的任何形式的健康信息进行市场行为操作,规定了受到约束的法律实体包括:医疗健康服务提供方、保险提供方和数据公司。同时HIPAA法案规定了数据脱敏标准,将风险控制在一个较低的范围。

技术层面:主要有四种:数据脱敏、加密数据计算、联盟数据分析及差分隐私。数据脱敏主要是去除可能识别出患者个人或其亲属、雇主等18种信息,包括姓名、地址、车牌号、社保号等;加密数据计算:王博士介绍了之前与中国国家研究中心、神州数码医疗科技股份有限公司合作过的一个基于34个省市的83万病人的加密数据实验:实验保持了出生日期和完整的邮编及性别,0.38%的病人会被唯一确认,但如果仅保留出生年份、三位邮编及性别,则只有0.01%的病人可以被唯一确认。

联盟数据分析:传统的多中心合作需要把数据从多个医院提取并存储到授信第三方进行相应计算,存在隐私和政策的风险。如果使用有隐私保护的联盟计算,即数据不离院的前提下,只需和第三方交换加密的统计值,然后更新全局模型,并且保证这个在分布式联盟计算的情况下面,得到与将数据集中后一致的结果。

差分隐私:通过技术手段添加干扰信息,使非法企图攻击并获取有价值数据的尝试失败,但同时能对授权的使用者提供正确数据。

复旦大学附属华山医院的林建华教授为与会人员分析了“大数据离不开标准化”的内容。

首届重症大数据与人工智能学术大会在京举行

林教授指出,现阶段,电子病例的推广使用、临床数据大量的积累、计算机能力的进步及人工智能发展推动了大数据在医疗行业的应用。比如临床检查中,钼靶检查,分子遗传诊断,远程医疗大数据可以防范偏差,减少医疗差错。此外利用大数据发现早期的传染病或辅助临床决策等。

今天成立了中国卫生信息与健康医疗大数据学会重症医学分会、标准委员会,要做什么呢?基本目标是优化临床路径,建立质控指标。实现患者疾病治疗全过程的纵向管理,最后实现患者自我参与的健康管理。而目标的实现,首先需要标准的数据源:要求临床上做到标准化的病理数据的录入;然后需要结构化的病例,我们叫“临床规范流程”;之后要建立一个质量指标,可用来衡量地区间、医院间数据的情况;最后建立一个共享平台整合健康产业链的智慧管理。

探讨二:临床术语体系及数据模型标准化

神州数码医疗科技股份有限公司高级副总裁弓孟春博士分享了中文临床术语本体体系的相关内容。弓博士指出,在临床实践中,不同地域不同医学传承和培训体系下,对于同一疾病大家可能表达的是一个意思,但是用词却不同,机器在识别这些表述时会自动将这些词语分成不同的代码,此时临床术语体系的标准化就显得尤为重要。只有通过标准化,我们在跨中心科研甚至跨国科研的过程中才能够充分发挥数据的力量。

首届重症大数据与人工智能学术大会在京举行

大家较为熟知的ICD虽然在诊断实现了归一化,但其与术语体系相差的还很远。SNOMED-CT是全世界重要的医学术语本体系统,可国际通用并在全世界五十多个会员国家使用,实用性非常广。

弓博士还介绍,神州数码医疗科技股份有限公司(以下简称神州医疗)也致力于临床术语体系的研发,由徐华教授授权的“NCCD”术语体系是中国药品的本体,主要将市面上的药典之间做了归一化处理,对于来源不一、描述不同的药品名和化学名都可以通过本体系统互相作归一。

另外在罕见病领域有一个尤为重要的本体系统,即CHPO,中文的人类表型本体。其中文版由中日友好医院顾卫红教授带头,神州医疗参与其中并积极推进相关工作。

IQVIA真实世界与分析解决方案开发部总监欧玉梅为与会者介绍了OHDSI及其提供的OMOP Common Data Model(OMOP通用数据模型)。

首届重症大数据与人工智能学术大会在京举行

OHDSI作为一个全球化组织,最早由美国哥伦比亚大学的学者创建。目前,其合作者可访问拥有10亿患者的网络,以生成有关医疗保健各方面的数据。目前拥有超过17个国家和地区,200余位来自学术界、政府和产业界的研究者;同时OHDSI的数据库网络涵括了来自17个国家和地区的12亿条患者记录,这些记录组成了超过82个数据库。世界各地的患者和临床医生以及其他决策者每天都在运用OHDSI解决各类医学问题。OMOP通用数据模型可对不同的观测数据库进行系统分析。主要基于将数据库中的数据转换为通用数据模式并以术语、词汇表、编码等通用形式表达,并使用通用格式进行系统分析。

探索三:真实世界研究与医院信息化建设及重症研究

神州数码医疗科技股份有限公司副总裁李洪教授从“使用真实世界数据时研究设计问题的思考”出发,分别阐述了大数据定义,使用大数据常见问题、大数据使用方法论及大数据应用的做与不做四个维度阐述了其观点。

首届重症大数据与人工智能学术大会在京举行

真实世界研究用到的数据具有真实性、实时性和关联性。美国的医疗保险公司,从信息产生到使用其周期是6个月。为什么要6个月?主要用于数据的采集、质量控制和资料的脱敏处理。由此可见,真实世界研究的数据并不是那么容易就建立队列并且具有一定的要求。较为基础的要求是数据的整个分布应为正态分布,但往往达不到这点。

同时李教授给出了在做真实世界研究时的几点建议:首先要做严谨的研究目标设定;其次是伦理委员会(IRB)审查,该审查在随机研究里是必要事情,但在真实世界研究中该如何处理,需要提前做好思考;其次要设计实际的落地计划。

中国医学科学院北京协和医院信息处处长朱卫国教授则从“医院信息化建设”层面做了深度剖析。

首届重症大数据与人工智能学术大会在京举行

朱教授指出,真实世界证据与其他证据的本质区别不在于研究方法和实验设计,而在于获取数据的环境,即真实世界研究的数据来源于医疗机构、家庭和社区,而非存在诸多的严格限制的科研场所。真实世界的研究并不是一个更新的方法,其相比传统的RCT其结果可信度也并不一定差。真实世界研究是可以进行随机设置从而进行干预的,与RCT可以作为一个互补的关系。

真实世界研究可应用场景较多,如药物安全性评价、病例分析、申论的扩展,回顾性研究等;而信息化建设主要体现在医院患者招募、随访等方面。

浙江大学医学院附属邵逸夫医院章仲恒博士为与会嘉宾做了“MIMIC数据库与重症研究”的结束报告。

首届重症大数据与人工智能学术大会在京举行

章博士介绍,MIMIC数据库是美国麻省理工提供的一个对公众开放的多参数重症监护数据库,里面提供了诸如心电信号(ECG)、光电容积脉搏波信号(Pleth)、动脉血压信号(ABP)和呼吸信号(RESP)等从ICU病房中采集的生理数据。该数据库经过多个学科10多年的建设,目前已被成功运用于ICU临床数据挖掘的多个研究领域。