数联医信杨紫陌:医疗数据现状混乱,实现数据应用之前先要做好数据治理|论坛演讲

作者:杨娟 2017-09-20 08:00

{{detail.short_name}} {{detail.main_page}}

{{detail.description}} {{detail.round_name}} {{detail.state_name}}

{{detail.province}}-{{detail.city}}
{{detail.setup_time}}
融资金额:{{detail.latest_event_amount}}{{detail.latest_amount_unit}}
投资方: · {{item.latest_event_tzf_name}}
企业数据由提供支持
查看

医疗对于人工智能具有强烈的潜在需求。目前,全球人工智能+医疗“基础+技术+应用”较为完整的产业结构已初步形成。新技术要想真正引起行业变革,不仅需要政策、技术、人才等多方面的协同配合,还需要企业的探索和时间的积累。为了探求健康医疗大数据和人工智能的未来发展和落地方案,2017年9月16日-17日,2017长江产业论坛(秋季)暨医疗健康大数据与人工智能大会在武汉会议中心盛大开启。


在本次大会上,成都数联医信科技有限公司的首席数据官杨紫陌,以《数据治理从医疗设备说起》为题,阐述了目前医疗数据的现状,数据治理的原因和方法,以及数联医信在医疗设备领域所做的数据管理实践。以下为动脉网整理的精彩演讲内容:


嘉宾介绍


杨紫陌.jpg


成都数联医信科技有限公司首席数据官杨紫陌女士


2013年毕业于电子科技大学。从本科阶段开始,一直从事网络科学与数据挖掘方面的研究,在国际SCI期刊发表论文十余篇,其中一篇入选ESI全球高引用论文,一篇被全球最顶尖的技术媒体MIT Technology Review(麻省理工技术评论)长篇专题报导(论文列表见后)。2012年,获第8届全国复杂网络学术会议最佳学生论文奖,系唯一获奖本科生。2013年,获得阿里巴巴校招“阿里星”。当年全国共7人获此殊荣,系其中唯一本科毕业生。在阿里集团先后负责电子邮件精准营销(淘宝)、商品实时推荐(淘宝)、线下淘宝搜索推荐(口碑网)、支付宝个性化首页(支付宝)等项目。系2014年-2015年支付宝全年个人绩效第一名(含并列),支付宝无线事业部全年个人绩效第一名。


首先,我想说明的是,数据治理是贯穿数据各个行业的,不仅仅局限于医疗设备里面,它可能贯穿的是医疗行业的各个数据,还包括很多其他的行业。

 

什么是大家心中好的数据?什么是一个你们觉得很想要的数据?我认为所有人都会这么想:我不管你以什么样的形式提供给我,我都希望数据库的数据是准确并且干净的。我需要的不仅仅是一个数据的结果,可能还需要一个配套管理这套数据的东西。而这个东西就是数据的操作规范,即所有针对这个数据的操作记录以及数据所有的权限管理。


医疗数据的现状


对于怎样应用数据,我们希望数据简单、容易查找,方便我们去做分析,去模拟和仿真。这是我们对一个好数据的期望。然而现在的医疗数据现状是什么样呢?


现在中国大大小小的医院里面,有成千上万种系统,每一个系统都有成百上千张表,它的结构非常的乱。比如患者的病历信息非常零乱,难以搜索筛查。以及在影像系统里面,影像本身就没有做任何的参数调整,所以我们说影像本身的数据是有偏差的。另外,药品的使用边界也不清晰,医生的操作也没有规范。

 

其实医疗行业很多的数据都是这样的,由于本身的不规范、没有标准,导致了数据虽然大但是很难应用。医疗数据本身是一个价值巨大的东西,但是由于内容混乱,根本无法发挥它的价值。我们有各种各样的信息系统,希望把所有的信息化整合在一起,但是这么多信息平台没有一个能够给出完整正确的数据。


为何要做数据治理?


怎么样解决数据治理的问题呢?很多人觉得数据治理是一个脏活累活,可能是需要一个个预处理,甚至花费很多人工成本。

 

我们先来看一下整个数据的发展史。最早是数据的生产,就拿医疗行业来说,随着这几十年信息化的发展,我们传统的数据也有了更好的方式,我们有了各种各样的信息,医疗数据有了一次完整的蜕变之旅。行业里很多专家对于医疗数据的设想都在应用,但这都是建立在本身拥有很好的数据的前提下,如果说不做前期数据治理和数据共享,是很难实现数据应用的。

 

为什么要做数据治理?原因在于目前医疗数据的现状非常混乱。我们希望通过整合医疗数据,规范医疗数据,形成医疗数据的通用语言,让它更方便的检索和分析。为什么在治理和应用中间还有一层共享?数据是一个很典型的1+1>2的东西。同时,它又是一个规模越大,发挥价值越巨大的东西。你告诉机器的数据量越大,机器给你的判断就会越精准,更方面我们做很多预测。


如何做数据治理?


如何做数据治理,把数据清洗补全,是不是有一个统一的标准就OK了呢?我认为这只是第一步。数据资产盘点和数据血缘治理,不仅仅是说把现在的污水清理掉,更重要的是把源头清理好。这套机制需要很多的专家经验,这样才能真正形成一套合理有效的数据机制。


整个数据治理,我认为有五个层面。最核心的层面一是业务数据,即对业务的理解。二是元数据清洗,三是数据标准化,四是数据集成共享,五是大数据融合管理平台。


数联医信用大数据管理医疗设备


数联医信主要是做医疗设备管理的公司。而医疗设备这个行业,我们可以看到,现在台账是比较混乱的,导致管理过程低效,售后服务受限,无法规范化巡检,存在质量隐患。如果利用数据来做分析,就相当于给每台设备一个身份证一样的东西。我们需要统一它的品类,至少我们要知道这个医院有多少监护仪器是同一种东西。我们现在做设备的标准化主要就是做这样的一个东西,对整个医院台账元数据治理的步骤。

 

对于新进的设备,我们更多的是用它的品牌图像去识别这个数据的品类。我们识别了包括B超在内的多种设备,平均耗时和准确率还是不错的。因为我们可以做到品类的规范化,所以可以把很多的巡检和维修信息放在AR(增强现实)中,通过AR可以看到巡检项目有哪些,故障有哪些。

 

然后,通过了解设备之前的故障历史,包括这台设备的品类和型号对它未来的故障做预测,目前基于现在的数据,故障预测的准确率基可以做到94%点多。这些都是基于整个数据整理以后,得到的可视化的东西。如果说不去做数据处理,这些东西很难得到大规模的统计和分析。


如果您想对接动脉网所报道的企业,请填写表单,我们的工作人员将尽快为您服务。


注:文中如果涉及企业数据,均由受访者向分析师提供并确认。如果您有资源对接,联系报道项目,可以点击链接填写基本信息,我们将尽快与您联系。

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

分享

微信扫描二维码分享文章

企业
对接
商务
合作
用户
反馈