生命奇点CEO刘立宇:如何实现数据分析应用,真正在数据中“淘金”

作者:动脉网 2018-07-25 15:48

{{detail.short_name}} {{detail.main_page}}

{{detail.description}} {{detail.round_name}} {{detail.state_name}}

{{detail.province}}-{{detail.city}}
{{detail.setup_time}}
融资金额:{{detail.latest_event_amount}}{{detail.latest_amount_unit}}
投资方: · {{item.latest_event_tzf_name}}
企业数据由提供支持
查看

“要实现真正的大数据分析,需要一个专门的面向数据二次分析的基础平台,也就是医疗大数据平台。它的特点是:面向数据分析的定位和技术架构,有完整的数据治理体系,以数据质量的管理为核心,可以产生深度的数据分析应用,真正在数据中‘淘金’。”7月12日晚,由生命奇点公司主办,主题为《赋能数据智慧医疗》的医疗数据和应用研讨会上,生命奇点创始人及CEO刘立宇表示。


此次活动为中国医院协会信息网络大会(CHIMA)的一环。CHIMA大会是国内医疗健康信息化影响力最大的行业大会之一。今年以“实施健康中国战略”为主题,涵盖数十场丰富专业的学术报告和研讨论坛,促进医院信息化领域的学科建设和自身发展,数千名来自全国各地医院的代表齐聚本次盛会,进一步改进医疗服务质量,提高教学科研和实际应用水平。


微信图片_20180725154641_副本.jpg

生命奇点创始人刘立宇


作为国内医疗大数据的领先者,生命奇点亮相本次盛会。


生命奇点创始人刘立宇在题为“医疗数据治理和应用”演讲中表示,在医院信息化发展的历程中,由各个业务系统数字化建设(全),到信息集成和数据整合(通),到今天真正的数据分析利用(智),以及如何通过系统的数据治理和数据应用作为抓手,将医疗大数据的治理和应用落到实处的构想。同时也分享了生命奇点公司的数据治理体系架构,标准化、结构化等核心技术,以及公司在数据治理和应用方面取得的成绩。


刘立宇表示,传统的CDR无法支撑深度的数据分析和应用,缺乏系统的数据治理及适合于数据分析的技术架构。目前的数据要真正落到应用必须要解决数据质量问题,而目前我们离高质量(广、长、深、准、精、全)的临床数据还有非常大的差距。做好数据治理需要一个高度跨界融合的团队协同工作。分享引发了与会专家的强烈共鸣和高度认可,有专家表示“这个行业需要踏踏实实来治理数据,提高数据质量的心态和公司。否则AI都是空中楼阁”。


以下为生命奇点创始人及CEO刘立宇演讲精彩观点:


中国医疗信息化经历了业务系统数字化建设(全面)的过程,目前正在建设“互连互通”的热潮中,后续的重点就是基于数据提升决策支持质量,实现智能化应用。


但是传统的临床数据中心CDR是否可以很好的支持基于大数据的智能化创新应用呢?我们在这些年的实践中发现:其实传统CDR的定位和技术架构都是面向业务数据共享,只是完成了数据汇集,离深度的数据分析还有一定的距离,这就是为什么今天很多CDR建设给业务部门带来获得感不足的原因。


要实现真正的大数据分析,需要一个专门的面向数据二次分析的基础平台,也就是医疗大数据平台,我们可以称之为CDR 2.0,它的特点是:面向数据分析的定位和技术架构,有完整的数据治理体系,以数据质量的管理为核心,可以产生深度的数据分析应用,真正在数据中“淘金”。


生命奇点在2016年推出了能够同时整合临床数据、生物样本、基因组学数据的大数据平台VitArk,建立起一套产品化的医疗数据治理体系,从数据整合、数据标准化、数据结构化、数据质量改进等各方面进行了探索和积累。


数据治理是一个现在被热烈讨论的词眼,但是它的内涵具体包含哪些方面呢,这是HIMSS在2012年总结的一个框架图,值得我们参考,另外,我们的数据治理的核心目标,就是数据质量,那什么样的数据才是高质量的数据呢,需要从哪些维度去关注数据的问题呢?


我们总结的几个维度,并且尝试分别用一个词去概括,就是:长度、宽度、精细度、准确度、标准度、完整度。


整个数据治理体系分为及格层次:基础的标准和规范层;数据治理的功能;数据应用层;数据治理的主要工作包括:数据集成、数据标准化、数据结构化、以及对业务数据的质控和质量提升。


在数据集成的角度,我们探索实践了一套能够快速集成的自动化流水线。对于一家大三甲医院能够在不到1个月的时间完成所有历史数据的汇集,并且内置了每天增长的质控规则库;在数据标准化方面,我们构建了生命奇点自己的通用数据模型、术语体系和统一查询计算框架。


在数据结构化方面,我们通过三年的积累,构建了百万级别的语料库,反复重构标注和模型,命名实体识别的性能F1已经达到97.9%,达到了整个行业的领先水准。基于数据治理的结果,我们在合作医院探索了很多数据应用。


在临床研究领域,我们和合作医院发现了几个候选的生物标记物,近期会有一篇重量级的学术论文发表,而且我们是研究的直接参与者,这点和其他大数据公司只是参与研究的前期数据整理完全不一样。


我们在临床决策支持和运营管理方面也已经有探索的成果。有赖于数据治理的基础,可以在大数据真正开发很多业务价值的应用。当然,数据应用并不是数据治理的终点,一个好的数据治理体系,一定是循环迭代的闭环。在数据分析应用的过程中,一定会发现已有数据的很多问题。通过数据应用,我们可以发现业务系统产生的数据质量问题,再结合智能化的技术和管理的手段,做出针对性的数据质量控制。


这样一套完整的数据治理体系,目前已经在国内很多医院落地应用。我们将持续探索,不断积累数据治理的经验和教训,探索国内医疗大数据治理的先行之路,为行业贡献自己的经验。惟有数据治理扎实深入,医疗大数据的应用和人工智能的应用才可能真正落地。

如果您想对接动脉网所报道的企业,请填写表单,我们的工作人员将尽快为您服务。


注:文中如果涉及企业数据,均由受访者向分析师提供并确认。如果您有资源对接,联系报道项目,可以点击链接填写基本信息,我们将尽快与您联系。

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

分享

微信扫描二维码分享文章

企业
对接
商务
合作
用户
反馈