动脉网知识库

V币充值

微信扫码进入充值页

充值完成后刷新本页查看余额

成为会员

微信扫描二维码购买会员

登录动脉网

少了专病电子病历,人工智能难以从0到1?

郝雪阳 2017-11-10 08:00

500364387_wx.jpg


很长时间以来,我国医疗大数据的发展都处于摸着石头过河的状态。医院的数据基础水平较差,应用能力相对薄弱,即使是在数据采集层面,也仍有很长一段路要走。

 

面对这样的现状,近两年国家频频拨款,加大力度推动医院信息化改造升级。


2017年9月,国家卫计委批复了四川大学华西医院、中国医学科学院阜外医院、北京大学人民医院、复旦大学附属儿科医院4家医院的大数据相关项目初步设计和投资概算共计6,771万元。其中,中央预算内投资4,200万元,其余资金由各医院自筹解决。三级医院信息化建设投资提速明显。

 

现阶段,国内三甲医院的建设重心基本放在了信息集成平台和互联互通平台上。为了落实《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》,以及《健康中国2030规划》,数据的结构化和质量,成为了医院下一阶段信息化建设的核心。

 

除了国家对数据的关注不断加强之外,业内普遍也在数据层面频频发力。而之所以如此注重数据的结构化和质量,恰恰是因为今后医疗大数据能否从概念落实为实惠,数据基础至关重要。

 

如果将2017年称为医疗人工智能的元年,想必不会有多少人反对。业内评价人工智能公司的实力,往往会综合算法、算力、数据三个方面的因素。而围绕这三要素的普遍共识是:算法难以成为企业未来的绝对核心竞争力,算力的高成本也绝非一般公司所能涉足,因此,数据成为了产业内各方竞争的焦点。

 

如何能够保证原始数据的数据质量专业化、结构化及数据维度多样化,让未来开发具有真实性和准确性的人工智能变为可能?一家名为索闻博识的大数据公司,给出了自己的答案:“前结构化”+“专病种”

 

前结构化比后结构化强在哪儿?


索闻博识的核心产品博识医疗云,是目前国内应用规模最大的专病种前结构化电子病历平台。目前已经有近500家三甲医院、近4000个科室在使用基于博识医疗云平台的应用。

 

过去,临床医生在进行科研工作时,往往花费98%的时间在整理病例和查找病历上,仅有2%的时间能够产生有效的科研价值。在使用了基于博识医疗云的病种前结构化电子病历服务之后,医生可以节省95%的数据整理时间,从而让他们可以把更多的时间放在对患者的诊断治疗、科研和文章的细节上。


未来医疗人工智能的发展,最核心的一点便是高质量的结构化诊疗数据。要想获取到这类数据,最优的实现路径则是基于专病电子病历的前结构化录入。


美国医疗信息化已经发展到以电子病历为核心平台,与其他业务单元进行整合,形成专病前结构化的大趋势。美国的临床医生已基本普及利用前结构化记录患者的信息,中国在这方面则远远落后。


目前,包括博识医疗云在内,国内仍有大量企业使用后结构化的方法处理存量信息 。但从本质来看,它只是中国医疗数据发展的一个过渡产物。


后结构化的优点是作为当下一种主流的数据处理技术,能够帮助医院处理存量数据,从过往保留的海量病历中导出结构化的数据,为医生的临床研究提供帮助。

 

它的缺点很明显,主要有以下四点:

1、原始病历内容缺失不完善,存量数据质量难以保证

2、需要集成院内各个系统实现数据的统一整理;

3、NLP等功能算法可重复使用性较低;

4、人工复核等企业运营成本极其高昂。

 

与后结构化相比,前结构化则有着以下几点优势:

1、医生能够直接输入主观信息并实时上传;

2、确保了数据从最初就以完善的内容和维度得以保存;

3、减少了数据处理的时耗及成本。


微信图片_20171106142430.jpg

 

从后结构化过渡到前结构化,索闻博识也并非是一蹴而就。

 

从2013年开始,索闻博识团队耗费了两年的时间整理、开发、测试整个博识医疗云的原型技术体系;2015年,博识医疗云定位服务三甲医院并开始推向市场,其中协和医院胸外科是其极具代表性的客户之一。

 

2015年时,协和医院胸外科和其他三甲医院胸外科医院,还处于传统HIS系统电子病历配合纸质病历的状态。这对胸外科的医生们造成了极大的困扰。


在与索闻博识接触后,索闻博识基于自主核心技术,快速帮助协和医院胸外科打造了一个完全符合诊疗路径,同时凝聚了协和医院胸外科临床经验的科室级专病种全结构化电子病历。

 

在电子病历平台上线之初,索闻博识采用后结构化处理(文本抽提+NLP)的方法,把医院过去5年历史的患者存量信息从医院系统里导出、清洗,并且导入到博识医疗云之中以便医生更好使用。

 

但在对历史信息的清理中,索闻博识团队发现除了纸质媒体导入的不便之外,最为挑战的是临床医生书写的不均一性。不同医生在措辞和用语方面的个性,给后期的自然语言处理带来了巨大的挑战。


如何破解这个难题?

 

在结合国外经验以及产品论证后索闻博识发现,如果采用前结构化的方法,通过高度定制化全结构化表单,医生通过点选和输入数据的方式实现主观诊断数据输入,让诊断结果直接生成,能够有效克服不同医生之间的语言差异,同时达到数据高质量地输入。

 

2017年,基于医院历史资料处理的磨合,索闻博识为协和胸外科的医生们量身设计了诸多操作细节和定制表单。临床医生们也越发体会到高度前结构化的电子病历在书写均一性上的优势。

 

经过一年多的临床应用,协和胸外科的医生们已经基本能将全部当期的住院患者信息用前结构化的方式记录在博识医疗云中。当然,这在博识医疗云的客户中并非个例。


专病电子病历比普通电子病历强在哪儿?


前结构化还有一个好处是:通过结构化的设计能让电子病历做到专病化。相对于传统电子病历,专病电子病历在信息维度、数据质量、病种专业化、适于应用方面,均有着明显优势。

 

在信息维度方面,专病电子病历可以针对特定病种的信息,依照医生需求做专门的采集,维度可以为1至无上限。泛病种病历只收集病种普遍信息,在数据维度上限制极大。

 

数据质量方面,专病电子病历仅针对该病种相关信息进行收集,超过80%的内容可以做到前结构化的定制,信息收集规范、统一。

 

在系统更新方面,专病电子病历可根据疾病的指南和发展方向不断更新迭代。而普通电子病历无法因为某一个或几个疾病的指南更新,药物发展而及时更新。

 

适于应用方面,只有高质量高数量的专病信息才能总结疾病的治疗情况,推动新药的研发,提高疾病的治疗效果。专病信息的收集,甚至可以看做是人工智能的基石。

 

怎样才能形成专病前结构化病历?


要形成专病前结构化病历,需要解决两个核心问题,一是实现快速定制。三甲医院之间,甚至是医生之间并没有太多共性化的需求,个性化需求偏多。医院除了诊断治疗外,还有大量的科研和疾病发展学科建设工作。

 

每家医院在同一个疾病领域都有自己的经验积累,在此基础上才同时运行着不少具体的临床科研项目。因此定制化对于三甲医院的临床科室来说,是一件非常重要的事情。

 

其二是能否快速迭代。以索闻博识三年来服务全国接近4000个三甲医院临床科室的经验来看,医院科室平均3-6个月便需要迭代一次电子病历。迭代内容包括医生在使用过程中功能改进的建议,以及诊疗指南和研究方向的改变。而这种迭代往往并不是断崖式的一次性更新,而是波浪式的持续累计下产生的质变。

 

总的来说,专病种电子病历是前结构化电子病历的前提。如果电子病历做不到专病化,就一定无法做到结构化。

 

目前主流的电子病历之所以是文本的形式,主要原因是医院在信息化升级的过程中,需要考虑科室与科室之间的标准化问题。但实际上,这种标准化牺牲的是学科的专业化。


可以说,前结构化专病电子病历能获得最高质量的医疗数据,而高质量的医疗数据是人工智能模型训练和算法应用的前提条件。 


下面这个案例,能够给出一些启示。

 

专病前结构化电子病历如何与人工智能相结合?


2017年,基于专病前结构化电子病历的技术经验,索闻博识开始尝试在人工智能领域发力。


中国人民解放军302医院的肝脏肿瘤中心、中国研究型医院学会分子诊断医学专业委员会联合博识医疗云于今年9月份发布了一项基于算法的成果:通过结合机器学习算法和临床医学方面的专业算法,打造了一款针对胆管细胞癌的诊断和生存概率的人工智能模型产品。目的是希望能够帮助更多的三级医院、二级医院的临床医生,准确地把胆管细胞癌从肝细胞癌中识别出来。

 

胆管细胞癌和肝细胞癌的生长部位都在肝区,在影像上看起来很相似,但其实它们是不同源细胞,两者的治疗方案存在差别。能够准确的识别和诊断胆管细胞癌并制订合理的治疗策略,对于患者具有巨大的意义。


微信图片_20171106142437.jpg

EN的AUC峰值最优


博识医疗云采用前结构化方法,首先先形成一个数千例的肿瘤数据集,该结构化数据集拥有近2000个字段维度。首先通过机器学习算法将字段的维度快速降维,高效率的压缩到合理的数量范围内,从而满足模型产品的易用性要求。


随后结合医学专业算法,利用机器学习模型获取的关键变量信息进行拟合,最后非常成功地搭建出基于疾病的发病概率和一年生存期等核心输出指标的人工智能产品。


从临床医生的角度,上述工作能够帮助他们建立患者风险评价标准,未来有可能会内化到中国的胆管细胞癌诊疗指南中。同时,博识医疗云这套模型算法不断迭代更新内化到既有产品平台中,包括网页端和移动端,从而让更多的临床医院通过公开的渠道使用该产品,应用到诊断和治疗工作中。


毫无疑问,从筛选出肿瘤细胞,到给出诊疗意见,索闻博识的人工智能在影像学之外,又开辟了一个新的应用场景。基于专病前结构化电子病历所建立的数据基础,在未来,索闻博识可以开发结合临床医生的需要,从机器学习、深度学习乃至复合型算法,实现更多场景的人工智能临床应用。


注:文中出现的采访数据,均由受访者提供并确认。如果您有资源对接,联系报道项目,寻求合作等需求请填写 需求表

声明:动脉网所刊载内容为动脉网及或相关权利人专属所有或持有,转载请联系tg@vcbeat.net。

还没有评论,快来抢沙发吧!

分享

微信扫描二维码分享文章