动脉网知识库

V币充值

微信扫码进入充值页

充值完成后刷新本页查看余额

成为会员

微信扫描二维码购买会员

登录动脉网

数联医信杨紫陌:医疗数据现状混乱,实现数据应用之前先要做好数据治理|论坛演讲

杨娟 2017-09-20 08:00

医疗对于人工智能具有强烈的潜在需求。目前,全球人工智能+医疗“基础+技术+应用”较为完整的产业结构已初步形成。新技术要想真正引起行业变革,不仅需要政策、技术、人才等多方面的协同配合,还需要企业的探索和时间的积累。为了探求健康医疗大数据和人工智能的未来发展和落地方案,2017年9月16日-17日,2017长江产业论坛(秋季)暨医疗健康大数据与人工智能大会在武汉会议中心盛大开启。


在本次大会上,成都数联医信科技有限公司的首席数据官杨紫陌,以《数据治理从医疗设备说起》为题,阐述了目前医疗数据的现状,数据治理的原因和方法,以及数联医信在医疗设备领域所做的数据管理实践。以下为动脉网整理的精彩演讲内容:


嘉宾介绍


杨紫陌.jpg


成都数联医信科技有限公司首席数据官杨紫陌女士


2013年毕业于电子科技大学。从本科阶段开始,一直从事网络科学与数据挖掘方面的研究,在国际SCI期刊发表论文十余篇,其中一篇入选ESI全球高引用论文,一篇被全球最顶尖的技术媒体MIT Technology Review(麻省理工技术评论)长篇专题报导(论文列表见后)。2012年,获第8届全国复杂网络学术会议最佳学生论文奖,系唯一获奖本科生。2013年,获得阿里巴巴校招“阿里星”。当年全国共7人获此殊荣,系其中唯一本科毕业生。在阿里集团先后负责电子邮件精准营销(淘宝)、商品实时推荐(淘宝)、线下淘宝搜索推荐(口碑网)、支付宝个性化首页(支付宝)等项目。系2014年-2015年支付宝全年个人绩效第一名(含并列),支付宝无线事业部全年个人绩效第一名。


首先,我想说明的是,数据治理是贯穿数据各个行业的,不仅仅局限于医疗设备里面,它可能贯穿的是医疗行业的各个数据,还包括很多其他的行业。

 

什么是大家心中好的数据?什么是一个你们觉得很想要的数据?我认为所有人都会这么想:我不管你以什么样的形式提供给我,我都希望数据库的数据是准确并且干净的。我需要的不仅仅是一个数据的结果,可能还需要一个配套管理这套数据的东西。而这个东西就是数据的操作规范,即所有针对这个数据的操作记录以及数据所有的权限管理。


医疗数据的现状


对于怎样应用数据,我们希望数据简单、容易查找,方便我们去做分析,去模拟和仿真。这是我们对一个好数据的期望。然而现在的医疗数据现状是什么样呢?


现在中国大大小小的医院里面,有成千上万种系统,每一个系统都有成百上千张表,它的结构非常的乱。比如患者的病历信息非常零乱,难以搜索筛查。以及在影像系统里面,影像本身就没有做任何的参数调整,所以我们说影像本身的数据是有偏差的。另外,药品的使用边界也不清晰,医生的操作也没有规范。

 

其实医疗行业很多的数据都是这样的,由于本身的不规范、没有标准,导致了数据虽然大但是很难应用。医疗数据本身是一个价值巨大的东西,但是由于内容混乱,根本无法发挥它的价值。我们有各种各样的信息系统,希望把所有的信息化整合在一起,但是这么多信息平台没有一个能够给出完整正确的数据。


为何要做数据治理?


怎么样解决数据治理的问题呢?很多人觉得数据治理是一个脏活累活,可能是需要一个个预处理,甚至花费很多人工成本。

 

我们先来看一下整个数据的发展史。最早是数据的生产,就拿医疗行业来说,随着这几十年信息化的发展,我们传统的数据也有了更好的方式,我们有了各种各样的信息,医疗数据有了一次完整的蜕变之旅。行业里很多专家对于医疗数据的设想都在应用,但这都是建立在本身拥有很好的数据的前提下,如果说不做前期数据治理和数据共享,是很难实现数据应用的。

 

为什么要做数据治理?原因在于目前医疗数据的现状非常混乱。我们希望通过整合医疗数据,规范医疗数据,形成医疗数据的通用语言,让它更方便的检索和分析。为什么在治理和应用中间还有一层共享?数据是一个很典型的1+1>2的东西。同时,它又是一个规模越大,发挥价值越巨大的东西。你告诉机器的数据量越大,机器给你的判断就会越精准,更方面我们做很多预测。


如何做数据治理?


如何做数据治理,把数据清洗补全,是不是有一个统一的标准就OK了呢?我认为这只是第一步。数据资产盘点和数据血缘治理,不仅仅是说把现在的污水清理掉,更重要的是把源头清理好。这套机制需要很多的专家经验,这样才能真正形成一套合理有效的数据机制。


整个数据治理,我认为有五个层面。最核心的层面一是业务数据,即对业务的理解。二是元数据清洗,三是数据标准化,四是数据集成共享,五是大数据融合管理平台。


数联医信用大数据管理医疗设备


数联医信主要是做医疗设备管理的公司。而医疗设备这个行业,我们可以看到,现在台账是比较混乱的,导致管理过程低效,售后服务受限,无法规范化巡检,存在质量隐患。如果利用数据来做分析,就相当于给每台设备一个身份证一样的东西。我们需要统一它的品类,至少我们要知道这个医院有多少监护仪器是同一种东西。我们现在做设备的标准化主要就是做这样的一个东西,对整个医院台账元数据治理的步骤。

 

对于新进的设备,我们更多的是用它的品牌图像去识别这个数据的品类。我们识别了包括B超在内的多种设备,平均耗时和准确率还是不错的。因为我们可以做到品类的规范化,所以可以把很多的巡检和维修信息放在AR(增强现实)中,通过AR可以看到巡检项目有哪些,故障有哪些。

 

然后,通过了解设备之前的故障历史,包括这台设备的品类和型号对它未来的故障做预测,目前基于现在的数据,故障预测的准确率基可以做到94%点多。这些都是基于整个数据整理以后,得到的可视化的东西。如果说不去做数据处理,这些东西很难得到大规模的统计和分析。



注:文中出现的采访数据,均由受访者提供并确认。如果您有资源对接,联系报道项目,寻求合作等需求请填写 需求表

声明:动脉网所刊载内容为动脉网及或相关权利人专属所有或持有,转载请联系tg@vcbeat.net。

还没有评论,快来抢沙发吧!

分享

微信扫描二维码分享文章