近年来,人工智能、大数据、5G等技术与医疗行业深度融合,加速推动了医疗产业变革。从人工智能在医疗领域的总体布局来看,图像识别、深度学习等关键技术的突破带来了人工智能技术新一轮的发展,促进了医疗产业与人工智能的深度融合。
据2019年1月国家癌症中心发布的全国癌症统计数据报告指出,2015年全国恶性肿瘤发病约392.9万人,死亡约233.8万人。恶性肿瘤已成为威胁人类健康的主要“杀手”之一。人工智能在肿瘤领域可否发挥作用?人工智能辅助肿瘤治疗现状如何?2019年6月23日在第一届智能肿瘤学天津论坛上,全国各大肿瘤医院的专家,企业、高校和科研机构的知名学者共济一堂,探讨我国人工智能技术的发展战略及其在肿瘤诊疗中的研究与应用。
天津医科大学肿瘤医院副院长徐波
本届会议不仅云集了来自全国各大肿瘤医院的专家,更邀请了中国科学院自动化研究所、南开大学以及国家超级计算天津中心等高校和科研机构的知名学者来到大会作报告。报告内容涵盖了人工智能技术的发展战略、肿瘤诊疗过程中影像组学与病理组学的分析应用、大数据平台建设、内外科应用实践和放射治疗应用等多个方面,为前来参会的观众奉献了一场医工结合的学术盛宴。会议由大会主席、天津医科大学肿瘤医院副院长徐波主持开幕式。
临床自然语言处理的发展
(徐华,美国德州大学休斯顿生物医学信息学院终身教授和生物医学计算中心主任,美国医学信息学院院士,哥伦比亚大学生物医学信息学博士。多年来从事医学信息学相关的方法研究、软件开发和实际应用。)
随着医疗信息化的不断深入,电子病例系统积累了大量的临床数据,但由于数据的来源复杂,而且大部分是非结构化的,自然语言处理(NLP)就发挥了重要的作用。最近几年,自然语言处理在医学领域上发表的文章数量一直在增长,当计算机具备了理解自然语言的能力时,机器才算实现了真正的智能。
现在算法已经有了很多种,也具备了让机器学习的大量数据,但是我们依然面临着自然语言处理的挑战:即能否实现既减少标注,同时又能训练很好的模型。徐华教授提供了两种方法:一是主动学习的方法,二是牵引学习的方法。
徐华分享了一个用NLP做临床数据研究的案例:二甲双胍是一种治疗糖尿病的药物,近期发现二甲双胍可以降低癌症风险。将糖尿病患者的电子病历数据库和肿瘤的注册库连接后,电子病历里的所有人都是肿瘤患者,同时还患有糖尿病。然后将患者分为服用二甲双胍和服用其他口服糖尿病药物的两组,并进行比对。结果显示,服用二甲双胍的患者生存期显著延长。在这个过程中NLP起到了什么作用。比如怎样定义一个糖尿病患者。如果是指向一个编码肯定是非常不准确的。因为有的病人可能被误判或者是因为其他的原因。但可以根据他是否服用相关药物记录,找到这个队列。或是抽烟,喝酒等,这些记录都存在于文本里,这就是NLP在这个案例中的应用。
医学信息学发展与医学人工智能
(弓孟春,中国国家罕见病注册系统(NRDRS)执行总监,负责国家级罕见病患者登记平台的建设及相关队列研究的规划;担任SNOMED International全球管理委员会董事。)
现在人工智能很热,基于人工智能技术也产生了一些临床证据新的生成方式和应用方式。弓孟春梳理出几个比较关键的点与参会者分享。首先是explained,即可解释性。这个解释不只针对监管机构,同时包含面向医生和病人。其次,需要高质量的数据库。如果能够在未来的工作中保证数据的高质量,将会有助于推进和支持医疗产业的发展。另外,人工智能在肿瘤学领域的应用支持,徐华教授分享的新的方向是重要的。
如何去借鉴人工智能在其他领域成熟的经验来支持医疗工作,在中国的环境下如何用新的技术产生数据,如何利用数据支持新药研发,支持临床研究,包括证据的产生过程中很多重要的部分,如因果关系推论,相关性分析等都需要用到人工智能技术。
基于知识库和多组学的智能临床决策
(郭栋梁,神州数码医疗科技股份有限公司副总裁,资深生物信息云计算专家。善长基于云计算的大数据信息数据模拟与仿真。2010年获得国际生物信息周刊,全球最有创意的20个项目奖。)
精准医学大数据主要由“表型大数据和组学大数据”组成,前者包括临床、影像、病理、随访等;后者包括代谢组、蛋白组、转录组、基因组、表观遗传组和微生物组。将这两大类数据整合,可实现多维数据即时响应临床决策,使得大数据路径由群体性医疗向个体性精准医疗路径转变。
多组学大数据的应用方向之一就是支持临床决策。对于临床决策的支持,郭栋梁提出了五个“正确”要素:即在工作流程中,通过正确的渠道,在正确的时间,在正确的干预模式下,向正确的人,提供正确的信息。
郭栋梁介绍了神州医疗的精准医学CDSS(基于人工智能的临床决策系统),该系统包含了四大知识库、一个生信分析平台和三个临床级的落地应用系统。知识库涵盖了肿瘤知识库、PGX知识库、重大疾病风险预测知识库和汉化罕见病库,基于知识库的生物分析平台可产生相关临床决策的信息来辅助医生进行临床科研。