动脉网知识库

V币充值

微信扫码进入充值页

充值完成后刷新本页查看余额

成为会员

微信扫描二维码购买会员

登录动脉网

医疗 AI 投资笔记:医疗数据,驱动医疗AI发展的动力

动脉网 2018-03-28 08:00

作者:同渡资本 杨成魁


2018年2月,对于医疗AI这个领域可谓惊喜不断。

 

张康教授团队,在顶级期刊《细胞》上发表了一篇AI在医疗领域应用的重磅研究成果:基于深度学习开发出一个能诊断眼病和肺炎两大类疾病的AI系统,准确性匹敌顶尖医生,该研究中应用了10万张准确标注的眼底数据和5000张胸部 X线数据。

 

FDA 批准第一款自闭症AI诊断产品,Cognoa公司的这款产品在研发过程中,通过为患儿和家长提供免费筛查服务,收集了大量真实环境的数据,构建和不断完善AI机器学习模型,累计经过25万儿童和家属的测试。

 

乐普公司基于人工智能技术的心电图自动分析和诊断系统“AI-­ECG平台”的医疗器械注册,获得FDA受理,进行注册审查。该平台从30万例患者心电图检查数据中,获取了约2500万份心电图数据样本,用以训练深度卷积神经网络模型。

 

以上这些重大进展的一个共性基础就是运用了“规模不小”的数据。罗氏宣布将以19亿美金收购肿瘤大数据公司Flatiron,总交易价值达到21亿美金,该交易更彰显了医疗数据的价值。数据好比燃料,是驱动 AI 发展的基础和动力。谈到医疗数据会涉及以下三个问题:


>>>>

1、医疗数据如何产生?

 

从医疗参与者角度,会涉及医院、患者、药械企业、保险、基因公司等角色,不同角色以及各角色之间的业务活动会产生不同的数据。

 

医院是最主要的医疗数据出处,分为临床数据和非临床数据。临床数据一般包括医学影像类(CT、X 光、MRI、超声、内镜、PET/PET-­‐CT 等)。医学图像类(生理信号如心电图、脑电图,显微镜下视野数字化,比如病理图像)。医学文本类(病历、手术记录、医嘱、检查/检验报告等)。随着精准医疗的发展,越来越多的基因数据产生,但目前还只是部分医院。非临床数据一般包括医保支付数据、医院运营相关数据。

 

以上提到的是已经存在的院内各种类型的数据,通过业务IT系统、设备、医疗人员行为等方式产生。但从数据的完整性、连续性角度考虑,只有院内诊疗数据是有局限的,结合院外连续的康复、生理状态、行为等数据方能发挥更大价值。但现实情况是,院外数据是缺失的,只有少部分出于科研需求,收集了一些随访数据。院外患者数据之所以缺失,有两点重要原因,第一是受限于技术手段,第二是缺少激励机制推动各方,两者相辅相成。

 

随着新型生物传感器、技术驱动的新模式的发展,将有机会促进院外患者数据的产生和应用,值得关注。例如,SANO是一家生物传感器公司,可以帮助糖尿病患者无痛的连续监测血糖水平,避免了扎破手指带来的痛苦,而DreaMed公司使用AI算法采集、分析包括血糖连续监测数据在内的患者数据,以调节胰岛素泵优化糖尿病治疗方案。


AiCure则是通过APP拍照获取患者数据,利用面部识别算法识别患者是否准备了正确的药物,以及是否已经摄取药物,以提高临床试验的用药依从性,避免由于患者用药依从性差导致的20-­‐30%的临床试验失败风险。

 

除了医院内数据、患者院外数据,药械企业、保险、基因公司等医疗健康机构在经营活动过程中也不断产生数据,这些数据对于促进医疗健康领域发展也是有重要意义,亟待挖掘。


>>>>

2、如何为使用做好准备?

 

信息化是数据产生的基础,中国医疗信息化经过20多年的发展,已取得了一定成果,各级医院都建成了不同程度的系统,但是由于初期并没有整体规划和设计, 导致医院各系统林立,标准不一,彼此间互通存在障碍,另外一点重要原因,这些医疗系统设计初衷是为了满足业务流程的运转,而并没有考虑积累的数据如何使用。


虽然业务系统积累了大量数据,但现实情况是“数据孤岛”、“数据质量差”,所以这些医疗数据是不能直接拿来使用的。

 

如果要发挥医疗数据的价值,必须建立在“多维度、规模化、结构化、标准化” 数据基础上。业务系统产生的数据,必经“数据集成和处理”这一过程,通俗的  讲,就是将各个系统各种类型的数据汇聚融合在一起形成“可分析”的数据集合, 数据采集和治理过程需要按照一定标准,清洗数据,将非结构化数据转化为结构化数据,尤其像病历、手术记录这种结构化程度差的医学文本类数据。由于医疗数据本身基础差、过往医疗体制封闭等原因,“数据集成和处理”过程是充满挑战的,不突破此过程,就很难发挥数据应用的价值。

 

随着国家医疗健康数据战略的推进,医疗数据将突破枷锁,加速汇聚融合。AI技术犹如催化剂,将使这一过程“更高效、自动化、低成本”。医疗数据“汇聚融合”将从各个层面、各个场景展开,上到国家数据中心,再到区域,再到医院、科室,再或者由于特定应用需求而发起的汇聚融合,比如临床试验、保险设计、单病种研究等。比如国内领先的医疗大数据公司医鸣数据,就是能够将临床数据“汇聚融合”,形成规模化的可分析单病种数据集合,可根据临床医生、药企、保险等医疗参与方的需求挖掘分析,发挥数据价值。

 

凭借先进的技术,能够加速医疗数据“汇聚融合”的产品或服务,将成为医疗数据价值链上重要一环,值得关注。但无论技术有多先进,在医疗这一敏感领域,不能忽视数据安全和隐私保护,也期望技术在这方面也能发挥重要作用。


>>>>

3、数据如何使用?

 

当有了规模化的可用数据后,数据挖掘与应用才变得可能。但现实情况是,数据汇聚融合并不是短期内就能取得很大进展,AI在医疗中的应用仍旧会面临数据基础问题,所以就决定了短期内AI在医疗不同细分领域发展的速度会不同。数据基础一定是要结合具体应用场景来看,医疗的复杂性导致了可能的应用场景众多,但不同的应用场景AI能解决问题的程度不同,也可能有些场景并不存在非常痛的点,即使AI能带来改进也难免鸡肋的角色,不同的应用场景数据基础也会不同。

 

应用场景明确,有迫切需要解决的问题,而且有良好的数据基础(可用数据规模大、结构化、标准化程度高),那么在加上先进的智能算法,就有可能产生非同凡响的应用效果。当下发展最快的医学影像AI,也正是得益于影像数据的基础好,而且作为疾病诊断的重要辅助检查手段,临床上存在诸多痛点,AI 在效率和医疗质量方面能带来很大提升。除了临床上的应用,AI在新药研发、基因数据挖掘等其他医疗健康领域亦有巨大的应用潜力。

 

新技术应用,能够带来用户使用价值是前提,能够商业转化才能可持续发展,所以在思考医疗AI应用时,将未来商业潜力(是否有明确的付费方?付费意愿及能力如何?潜在商业规模有多大?)考虑进来是十分必要的。


微信图片_20180328110905.png

线下沙龙报名二维码


微信图片_20180328110859.jpg


注:文中如果涉及动脉网记者采访的数据,均由受访者提供并确认。如果您有资源对接,联系报道项目,寻求合作等需求请填写 需求表

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

还没有评论,快来抢沙发吧!

分享

微信扫描二维码分享文章