动脉网知识库

登录动脉网

投入8亿资金,医渡云专注医疗大数据

动脉网 2018-04-17 15:28

现阶段,国内医院信息化系统种类已经超过4000个,平均每家医院超过100种。这些系统对数据的结构和表达存在很大差异,其中有超过半数数据是自然语言文本。再加上科室医生对信息的书写方式各不相同,这种极度复杂性让计算机很难理解数据。


完全由人工来执行,即使是500人,终其一生也无法处理数十亿份病历。


有这么一家公司,经过4年的努力、超过8亿元的投入,纵深大量疾病研究,打造未来数字医疗的基础设施,最终获得了近百家中国顶级医疗研究机构(排名前150)和政府机构的认可。其名为:医渡云。


微信图片_20180417102145.jpg

医渡云创始团队(图片由医渡云提供) 


“20 人、8 亿元、12 亿份、2000 万个”


2013年,医渡云成立了一支20人的团队。他们秉承以“可用数据作为基础,新型医疗才是未来”的信念,埋首于医疗大数据、人工智能基础平台研发。

 

如今,他们协助医疗机构完成了超过12亿余份病历资料的数字化与数据化处理,从中建立了超过2000多万个诊断名的标准化。平均每天的病历处理数量约为70万份,每天至少需建立超过1.5万个标准化诊断名。


国内排名前 150 家医院中,有三分之二都是他们的合作客户。2018年,他们还计划与10个省市政府机构,合作建立起区域化医疗数据平台。

 

人工智能的复兴,在中国出现了许多赢得巨额融资的初创公司,没有镁光灯照射的医渡云,在行业中显得有点“默默无名”。尽管获得大型投资机构投资,从技术开发、落地、到串起产学研三大环节,独角兽的身价,他们却从未对外公布。

 

把原始数据变成可用数据,即“大数据的基础处理”,是医渡云的原点。

 

“医疗这件事,大家都想做,比如说挂号、帮你找专家等,我不否认他们的价值,但最基础的工作,是把原始数据变成可用数据这种‘脏活’,没人愿意做”医渡云创始人宫如璟开玩笑的说。


事实的确如此,建立基础的活最难做,就像盖房子打地基一样,很少有初创公司会像医渡云一样选择切入技术门槛很高的基础系统。

 

截至目前,医渡云处理病历数累计12亿余份,整理出2000多万个诊断名。他们将分散的、非结构、非标准化的数据自动转化成标准可用的数据,并且汇集在一起。

 

有了这个一致化的数据集后,基础架构平台的价值就体现出来。

 

敢啃“硬骨头”,才能构建起庞大规模平台


绝大部分大数据和人工智能企业选定1-2个领域切入,医渡云却将战线拉得很长:开发的“医学数据智能平台”(DPAP)涵盖从基础科研、临床系统、医院管理系统,再到跨院跨区的合作共享,但却又能全盘统筹、协作有秩,而非“PPT造车”式的纸上谈兵。

 

医渡云的判断是:在数据领域产生质的突破,才能解密整个产业链。这也是产业链中最“硬“的骨头。


除了重视隐私保护的行业特性,使得对科技的评估、导入相对较慢之外,很多数据是属于非结构化甚至医生个性化的自然语言文本。例如医生主观撰写的病历、巡诊纪录,而且信息散落院内各部门,这直接导致了数据运用之难。

 

要突破这个瓶颈,首先得有一个基础设施平台,接着再让平台上长出各种智能模块,并且能与医院现有的系统对接。


对此,医渡云用三年半的时间专注开发出一个整合性极强的医疗数据处理系统,能把原始零散的不可计算数据变成高质量可计算数据。平台上聚集了大量知识图谱、 300 种以上的智能处理模块以及20余种专病库。

 

这件事有多难?医渡云首席技术官(CTO)徐济铭举了一个具体的例子,同一个疾病,每位医生的写法可能都不同,例如“二型糖尿病”的”二”,有人写汉字、阿拉伯数字等,还有人会写糖尿病二型、或是 Type 2 Diabetes 。


很多拗口的疾病有更多复杂的写法,尽管在医疗诊断里有所谓的国际疾病分类编码标准(ICD),不过也才 2 万多种,不足以应付实际情形的发展。

 

想要解决这个问题,就必须让机器看懂不同说法其实都是指同一种疾病。而这个问题还只是DPAP平台上众多问题中的一个“小”问题。要解决它,需要计算机对自然语言中词语的结构和语义有着深刻的理解。

 

医渡云开发的基础平台,可以把过去分散的、来自不同厂商的数据,快速转变为标准化数据,且该数据符合 CFDA 和美国食品药物监督管理局(FDA)的认可。

 

300个模块功能背后的超长战线

 

医渡云的四位创始人不断提及一个理念:“改善人类与疾病的关系”。具体要如何”改善”?这个重任实际上落到了医疗大数据平台上。

 

真正制约医疗大数据发挥价值的主要瓶颈,在于数据平台从集成到处理,再到应用这三个维度的能力。这意味着,仅仅将数据从不可用变为可用,只是医渡云使命的起点,如何在可用数据的基础上构建出相应的应用,同样是至关重要的一环。

 

在数据智能驱动下,其核心基础“医学数据智能平台“已经搭载了300多个应用模块,贯穿整个医疗过程。


在临床辅助诊疗上,结构化数据按照不同的功能模块呈现,准确反映每个患者在整个治疗周期中的病情进展。DPAP通过对散落的数据整合,构建患者的时间轴模块,以诊疗事件时间为主线,完成疾病数据建模。从疾病的角度来看,DPAP还能够提供疾病数据模型。


无论是疾病数据模型,还是患者诊疗模型,都是临床科研、路径挖掘、疗效评价、辅助诊断应用的基础。


根据国际国内医学标准,目前医渡云已经完成了对不少疾病的不同核心信息的整合和识别,构建出25个大病种、3000多个疾病的模型,并且这个成果数字还在不断扩大。

 

目前,支撑医渡云所拥有的300多个功能模块的技术,涵盖了近年来颇为关键的基础算法和人工智能技术,涉及医学自然语言处理、医学影像处理、医学知识图谱构建、医疗大数据挖掘、大规模(深度)机器学习模型及应用等。

 

爬过15座山之后迎来质变


对大数据好人工智能企业而言,最大的挑战在于落地。2017年,医渡云开始将产品商业化。国内150 家顶级医院中,有三分之二都是他们的合作客户。


“第一家是最难的,花了1年2个月才上线,前 15 家几乎没有网络效应,产能上不去,很痛苦。”宫如璟回忆说。


医渡云在 2013 年成立时,尽管行业能接受这种大数据、AI 创新的理念,但部分医院的策略仍偏保守,更大程度上是出于与商业公司进行数据合作在数据安全性与合规性上的担忧。直到医渡云的数据安全技术、数据合规保障机制一步步被医院感知,这一瓶颈才被打破。


“机器”看多了、学多了,系统就变得更聪明。医渡云的产品慢慢吸引了众多专家、医院的关注。例如中山大学附属肿瘤医院携手医渡云进行大数据战略合作,并在业内知名的《柳叶刀》(The Lancet)期刊上发表了与鼻咽癌相关的论文。目前双方在鼻咽癌、结直肠癌和肺癌等方面开展了科研合作。

 

“在跨越了 15 家客户后,平台网络的价值快速扩大,量变产生质变。”目前,医渡云已处理医院10几年的数据,完全不用人工,最快两周就可以完工上线。

 

医疗行业是一个门槛很高的行业,再加上科技巨头、初创公司全都聚集于此,竞争更加激烈,宫如璟的信心来源,很重要的一点便是团队实力。

 

宫如璟在英国求学期间蝉联了五年全英数学冠军,在华尔街投行 14 年的历练;CEO 孙喆曾联合创立北京惠旭金信,主要关注医疗行业投资,在医疗行业有丰富的投资和经营实践经验。

 

医渡云CTO 徐济铭则是中国科学院研究生院计算机应用专业硕士,曾负责百度搜索服务团队、框计算团队等核心技术团队,也曾获选百度最有价值员工。首席战略官(CSO)何直,早先曾是阿里巴巴集团产品总监,领导了天猫大数据平台建设,在连续创业的历程中,先后创立了专攻大数据挖掘的精准营销软件及服务的杭州数云信息等四家公司。

 

宫如璟笑着说,现任首席数据科学家彭涛,“还是当时跟今日头条抢的,他选择加入我们,是因为他觉得我们的东西更难,更有挑战。”。

 

2017年年底,前微软亚洲研究院资深研究经理闫峻加入了医渡云。专攻自然语言处理与知识工程研究的闫峻,出任首席人工智能科学家,并且延揽了美国斯坦福大学统计系教授王永雄,担任首席数据科学顾问,进一步强化了这家学霸公司的阵容。

 

随着业务快速增长,医渡云的团队人数连年翻倍。2018年年底,预计人数会达到 800余人,其中研发团队占比高达60%,其中大部分都是来自全球、国内的知名互联网公司和顶尖实验室。剩余20%则专注在医学领域。

 

跨区整合,数据智能辐射至药物研发和医保


建立跨区的数据中心,将是医渡云2018年的工作重点,预计公司将建立 10个左右省级层面的区域医疗数据中心,孙喆向记者透露。

 

据悉,医疗数据中心会把当地的三甲医院、二级、三级医院的数据集中到区域云平台上。跨院数据的集中共享,能帮助患者建立起一个完整的患者健康档案。患者不必带着病历四处求医,医院之间也能有效的为患者提供全面的健康服务。

 

对于药物研发的效益,医渡云希望推动医院和医院之间的联合。例如每一家医院现在都有自己的新药研发基地,当制药企业某个新药研发项目联合区域的时候,承接能力会变得更强,将会加快新药上市。“同时也可对政府提供整个公共决策的支撑”孙喆强调。

 

2017年,医渡云与重庆医科大学联合共建了重庆医科大学医渡云医学数据研究院,这是国家首个医学数据二级学院。另外,医渡云还与国家食品药品监督管理总局(CFDA)展开了药品不良反应的合作,基于整个重庆区域人群分析基础之上,有效分析出该区域的药品使用情况、具有重庆特殊性的不良反应等,这就是区域平台的庞大效能。

 

通过这样的合作,除了帮助政府部门了解中国药品不良反应的发生情况,还能拉动制药产业建立一个聚集产、管、学、研力量的优质监测机制。

 

由此可见,医渡云的服务已经从最初只面向医疗机构,走到了区域平台、辅助公共决策的层次。


除了临床试验外,新药上市后的不良反应监管一直也是业界的难题。

 

传统模式下,这种监管依赖于医生的主动上报,或者企业需要调动非常多的人力资源,在新药上市后去医院采集相关的信息。整个过程很容易出现错误、疏漏。对此,医渡云承接了重庆医科大学和CFDA 不良反应管理中心的专项课题,研发基于大数据和算法的智能监察系统。

 

制约医疗行业变革的另一个核心因素是医保的管理。只有医保作为支付方能更加科学的去评估一个疾病的支付方式和定价,才能从根本上帮助整个医疗市场形成良性循环。

 

近期,医渡云即将宣布与清华大学自动化系合作建立智慧医疗自主系统联合研究中心,针对医保领域的应用从理论和方法上进一步深入创新。

 

4月12日,国务院总理李克强主持召开国务院常务会议,确定发展“互联网+医疗健康”措施,缓解看病就医难题、提升人民健康水平。


“互联网+医疗健康”,已经为中国医疗行业变革的重要举措。近日,医渡云与人民健康在医疗大数据领域推动医疗创新产业发展、共同搭建人民健康云平台,并在医疗数据质量评价体系研究与评价标准制定等方面开展广泛合作。医渡云的这些探索,将助力“健康中国”战略实施和“国家大数据战略”落地,促进医疗产业和外部产业融合发展。


注:文中如果涉及动脉网记者采访的数据,均由受访者提供并确认。如果您有资源对接,联系报道项目,寻求合作等需求请填写 需求表

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

还没有评论,快来抢沙发吧!

分享

微信扫描二维码分享文章