Google发布用于基因数据解读的AI工具,产品会在谷歌云提供给用户使用
{{detail.short_name}} {{detail.main_page}}
{{detail.description}} {{detail.round_name}} {{detail.state_name}}
近日动脉网获悉,Google发布了一个名为DeepVariant的工具,它使用最新的人工智能技术,从测序数据中构建出一幅更准确的人类基因组图像。
DeepVariant帮助将高通量测序读数转换为完整基因组的图像,并自动识别测序数据中的小插入和缺失突变和单碱基对突变。
进入新世纪,高通量测序的广泛应用使得基因组测序变得非常容易。但是基因测序生成的数据仅提供了有限的,容易出错的全基因组快照。对于科学家而言,区分测序过程中产生的随机错误的小突变,特别是在基因组的重复部分中的突变,挑战性非常大。而这些突变可能与癌症发生直接相关。
目前,市场上存在很多解读这些数据的工具,比如GATK、VarDict和FreeBayes等。这些软件工具往往使用更简单的统计和机器学习方法通过尝试排除错误读取来识别突变。
哈佛大学公共卫生学院的研究科学家布拉德·查普曼(Brad Chapman)表示:“挑战之一是在基因组的困难部分,每一种工具都有各自的优点和缺点。都不是十分的完美。这些困难的地区对于临床测序来说越来越重要,解读的方法越多越好。”
DeepVariant由Google Brain团队的研究人员开发,该团队专注于开发和应用AI技术。另一个Alphabet子公司Verily负责生命科学这块。
在一个名为瓶颈基因组Geneome in a Bottle(GIAB)的项目中,团队收集了数以百万计的高通量读段和完整测序基因组。GIAB项目是一项公私合作的项目,旨在推广基因组测序工具和技术。他们将数据输入到深度学习系统中,并精心调整模型的参数,直到系统模型可以准确度解释基因数据。
去年,DeepVariant赢得了Precision FDA真相挑战赛的第一名,这是一个由FDA举办的比赛,旨在促进更精确的基因测序。
Deep Genomics首席执行官Brendan Frey说:“DeepVariant的成功很重要,它表明了在基因组领域,深度学习可以用来自动训练系统,其表现优于复杂的手工操作系统。”
DeepVariant的发布标志着机器学习可能促进基因组学迈向新台阶。
Deep Genomics是尝试通过AI方法(例如深度学习)梳理出疾病的发病基因以及鉴别出潜在的药物治疗的少数几个公司之一(动脉网了解到,推想科技的首席科学家熊辉远是这个公司的联合创始人)。
Frey说:“人工智能会发展的越来越好,不仅仅是帮助测序基因组数据。目前阻断药物(开发)的核心问题在于我们无法准确地将遗传变异与疾病机制进行对照,并能够利用这些知识快速确定拯救生命的疗法。”动脉网从国内多名专家那里了解到,人工智能技术的快速发展,将会发现人类未知的疾病与诱因之间关系,扩大人们对疾病的认知。
DeepVariant也会在Google 云平台上提供给用户使用。Google和它的竞争对手都在将机器学习功能添加到他们的云平台上,以吸引任何想要使用最新的AI技术的人。
总的来说,AI在未来几年会帮助医药领域在很多方面取得了巨大飞跃。AI也有很多机会可以从图像或医疗记录中挖掘出许多不同种类的医疗数据,比如,预测出那些人类医生可能会错过的疾病。
基因组医学代表了一个重大的机遇,因为数据的规模和复杂性是前所未有的。Frey说:“这是历史上第一次,我们测量生物的能力,操作的生物的能力,远远超过了我们理解它的能力。AI是我们解释和处理海量数据的唯一技术。这将彻底改变医学的未来。”
文章来源:MIT Technology review
原文链接:https://www.technologyreview.com/s/609647/google-has-released-an-ai-tool-that-makes-sense-of-your-genome/
如果您想对接动脉网所报道的企业,请填写表单,我们的工作人员将尽快为您服务。