动脉网知识库

成为会员

微信扫描二维码购买会员

登录动脉网

Deep Genomics:一家将深度学习带到基因组学的创业公司,已融资1670万美元

胡宇 2018-01-15 08:00

基因组学正在探索DNA变异如何影响特定疾病,使用机器深度学习对DNA和细胞中关键分子的关系进行建模,从而让基因组学的研究更有效。


在用深度学习研究基因组学的时代,Deep Genomics推开了第一扇窗。Deep Genomics,即“Deep Learning + Genomics”,是人工智能和基因组学联姻的产物。


>>>>

公司背后的灵感来源于生活


Deep Genomics成立的起因还要追溯到2002年,当时Brendan Frey的妻子怀孕,在做检查时却被医生告知还未出生的孩子可能带有遗传缺陷,尽管只是“可能”,但这对夫妻也不得不终止妊娠。


从那时起,Frey科研工作的目标就转移到使用深度学习来理解基因工作原理。于是这位多伦多大学电气和计算机工程教授、深度学习领域的先驱,开始关注基因组和医学的研究,试图将其与深度学习结合起来,设计出一种帮助机器学习和解释遗传密码的方法。


 QQ图片20180108163141.png

Brendan Frey和他的团队


2015年,Brendan Frey与Hannes Bretschneider等人成立了Deep Genomics。公司有20多名拥有高等学位的团队成员,包括科学、工程、医药和商业领域的专家。


该团队在自然、科学、细胞和自然生物技术领域发表了十多篇论文,获得了众多的科学和创新奖,并积累了超过50年的经验,建立了精确结合了基因组生物学的人工智能系统。


这个由机器学习专家、基因组学专家和医疗专家组成的团队有着强大的技术支撑,公司在建立伊始就被《科学美国人》、《华盛顿邮报》等知名媒体报道,比作“将深度学习的能量带到基因组学的创业公司”。目前,这家公司已经与医院、生物科技创业公司以及制药公司展开合作,使用基因疾病患者的基因数据测试公司系统。


>>>>

当基因组学遇上深度学习


要推进基因组学,就需要了解基因表达是如何被基因变体所改变。尤其是那些在蛋白质编码区之外的基因,DNA剪接是其表达的关键步骤,它的破坏会导致某些疾病产生,如癌症和神经系统疾病。


2C5DJ(GYJ[{BKPMJBGAF@0N.png


Deep Genomics开发的一种计算机深度学习技术可以计算出遗传变异对DNA拼接的影响。该技术的思路是建立一个数学模型,导入健康人的全基因组序列和RNA序列,对模型进行训练,让它学到健康人的DNA剪切模式,并用分子生物学方法检验模型,加以校正。


91_EU$E~])ZC%0PP%OPIJ)S.png

“深度学习”揭示了疾病的遗传根源


该模型能够准确地对疾病的变异进行分类,并提供异常剪接对疾病影响的见解。除此之外还可将其用于研究多种疾病,如:结肠直肠癌(Colorectal Cancer)和脊髓性肌肉萎缩(spinal muscular atrophy)自闭症(Autism Spectrum Disorder),并确定常见、罕见甚至自发变异的结果。


>>>>

从技术走向产品


Frey领导的研究小组开发的第一个深度学习方法,是用于确定疾病的遗传决定因素。他解决的痛点是,人群中的DNA突变(SNVs)数以亿计,其中突变频率大于1%的SNVs也有300万个左右,要挨个调查SNVs与各种疾病的关联难如登天。


在前面所述建立数学模型这一思路下,Deep Genomics推出了他们的第一款产品SPIDEX。只需将测序结果和细胞类型导入,SPIDEX便可分析出某一变异(基因组突变)对RNA剪切的影响,并计算出该变异与疾病之间的关系。 

  

SPIDEX产品设计思路:


建立计算模型


使用“深度学习”算法来推导出一种计算模型,该模型以正常DNA序列作为输入,通过将健康人体组织中具有剪接水平的DNA与DNA片段相关联,来推断剪接的计算模型。


假设有一个测试变量,它可能有多达300个核苷酸进入一个内含子,该模型可以用来计算变量的剪接有多少。


@0Q]SN@K%3UP6BKXI0~]%_I.png

建立计算模型


使用模型检测破坏性遗传变体


由广泛的疾病和技术引起的遗传变异,可以通过该计算模型被检测和过滤,从而对疾病的遗传进行探索。该模型预测了由于内含子和外显子的变异而导致的大量异常剪接,为理解疾病的遗传决定因素提供了新机会。


}GC)1_6~F7(TZ_41SR76GF2.png

使用模型检测破坏性遗传变体


SPIDEX可以将无害的突变与有害的突变区分开来,并帮助科研人员理解它们与其他基因过程的关系。2016年,Deep Genomics为弄明白突变会如何改变细胞,进而给人体造成的影响,用SPIDEX预测了3.28亿个SNVs。不过,预测只是做了初步筛选,而有害突变与疾病的对应关系还尚未建立。


如果Deep Genomics的深度学习分析变得足够精确,那么这项技术的贡献就显而易见:直接分析突变频率低的变异与疾病的关系;加速基因组学的研究和药物的开发。


然而,目前Deep Genomics的SPIDEX技术只能分析SNVs引起的RNA剪切变异与疾病的关系,对于其他原因导致的疾病无能为力。但即便如此,人工智能在基因分析中的应用仍然值得期待,也许它会成为解码基因与疾病奥秘的一把金钥匙。


Deep Genomics 在技术方面的成果已经发表在Science、Bioinformatics、Nature Biotechnology等知名期刊上:

  • Efficient in vivo correction of a splicing defect using an HDR-independent mechanism. Kemaladewi et al. Nature Medicine, July 2017.


  • Inference of the human polyadenylation code. Leung et al. RECOMB, April 2017.

    Genome-wide characteristics of de novo mutations in autism. Yuen et al. NPJ Genome Medicine, August 2016.


  • Machine learning in genomic medicine: a review of  computational problems and data sets. Leung et al. Proceedings of the IEEE, January 2016. 


  • Predicting the sequence specificities of DNA- and RNA-binding proteins by deep learning. Alipanahi et al. Nature Biotechnology, August 2015.


  • The human splicing code reveals new insights into the genetic determinants of disease. Xiong et al. Science, January 2015.


  • Deep learning of the tissue-regulated splicing code. Leung et al. Bioinformatics, June 2014.


2017年9月,Deep Genomics宣布开始进入药物研发领域。使用深度学习和超大神经网络来分析基因组数据,通过鉴定一个或多个负责疾病的基因帮助研究人员开发出一种药物来处理缺陷基因的行为。


Deep Genomics认为,他们的技术可以通过在大量的基因组数据中寻找微妙的信号,从而帮助药企生产强大的新药。


在未来的2年里,深度基因组学将利用其平台开发新的抗感寡核苷酸疗法并进行临床评估。如今,深度基因组学正在建立一个生物学上精确的数据和人工驱动平台,支持遗传学家、分子生物学家和化学家的研究应用。


>>>>

融资情况


2015年11月,Deep Genomics公司宣布完成370万美元的种子轮融资。由位于湾区的True Ventures领投,Bloomberg Beta和其它投资方跟投。


2017年9月,Deep Genomics获得了Khosla Ventures领投,True Ventures跟投的共计1300万美元的A轮融资。


截至目前,Deep Genomics所获累计融资额为1670万美元。


>>>>

类似公司


Atomwise,旧金山 (San Francisco),加利福尼亚州


V1[U%_YCT~Q9N1}XA$E(W(R.png


Atomwise公司成立于2012年,核心技术平台称为AtomNet——一种深度卷积神经网络。通过自主分析大量的药物靶点和小分子药物的结构特征,AtomNet可以学习小分子药物与靶点之间相互作用规律,并且根据学习到的规律预测小分子化合物的生物活性,从而加快药物研发进程。


Recursion Pharmaceuticals, 盐湖城 (Salt Lake City),犹他州


E{38_7OFEV8`P(%{%XF8D72.png


Recursion公司成立于2013年,它有一个雄大的目标:在十年内找到100种疾病的治疗方法。这家公司的核心技术是运用计算机视觉技术来处理细胞图像,并且通过分析1000多种细胞特征来评估疾病细胞在给药后的效果。使用先进的成像技术和人工智能技术,这一平台可以进行高通量的细胞模型实验,在上百种疾病的细胞模型中进行上千种候选药物的检测。


Insilico Medicine, 巴尔的摩 (Baltimore), 马里兰州


_(B`0``O0H9~`8Z``WFP5[S.png


Insilico Medicine公司成立于2014年,宗旨是延长人类的健康寿命。为此,该公司收集了大量不同年龄的健康和患病人群的多类组学数据,并且利用机器学习对这些数据进行综合分析,从中找出与衰老和疾病有关的生物标记物,并且根据这些数据寻找上市药物的新功能,发现新的抗衰老药物。该公司的另一项业务是与研究所和制药公司合作,利用自身对深度神经网络机器学习的专长,帮助它们进行药物研发、发现生物标记物和开发研究衰老的新工具。


7HI][4%@7{Z]US5@`_(_2CN.png


基因生物学,作为一个独立的研究领域,正在源源不断的产生数据。我们可能很快就能足不出户地使用一台比手机还小的设备来完成基因测序。而基因本身还只是故事的一部分:大量的数据是用于描述细胞和组织的。


虽然我们难以掌控这些数据,但机器学习可以帮我们解决这些问题。深度学习已经成功应用于那些人类天生擅长的领域,如图像识别、文本和语言理解。


然而人类的大脑并不是天生为理解基因组而设计的。这种差距的存在,决定了处理基因问题必须使用”超人类智能",因此,在基因药物领域,深度学习理论的应用正在起飞:它能够对诊断,护理,制药以及保险领域产生冲击性的影响。而医药就是深度学习的下一个前沿话题。


注:文中如果涉及动脉网记者采访的数据,均由受访者提供并确认。如果您有资源对接,联系报道项目,寻求合作等需求请填写 需求表

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

还没有评论,快来抢沙发吧!

分享

微信扫描二维码分享文章