登录

DeeCamp2022 结营,AI如何挑战生命科学关键难点?

作者: 杨雪 2022-09-05 08:00

AI+生命科学发展历史中,AlphaFlod2解决了困扰生物学界长达50年的蛋白质空间结构预测难题,成为AI+生命科学领域里程碑事件。

 

在全球AI+生命科学技术快速发展背景下,全球已披露超过 30 款 AI 技术参与研发的药物进入临床试验阶段,资本市场上也受到认可,全球已有 10 多家公司成功上市。

 

未来,AI+生命科学还有哪些其他的想象空间?在由创新工场和清华大学智能产业研究院联合主办的DeeCamp人工智能训练营中,来自AI与生命科学跨学科领域的多位高校学员给出了自己的答案。

 

在刚刚过去火热的2个月中,来自清华大学、北京大学、南洋理工大学、复旦大学、中科院计算所、香港中文大学等全球各个地区顶尖高校的计算机、生命科学等专业的150多位学员自发组成30支队伍,多所顶尖高校的30支参赛队伍,聚焦用AI探索生命科学新边界这一主题。

 

最终入围辩论赛的6支队伍,尝试基于人工智能技术解决生命科学领域的PROTAC药物研发、大规模蛋白质组学信息发现、药物分子发现、全基因组表达预测、蛋白质相分离能力预测、蛋白结构预测酶活性等问题,最终挑战大规模蛋白质组学信息发现赛题的ProteinMiner团队摘得DeeCamp2022总冠军的荣誉。

 

在本次大赛中,多支参赛团队关注的问题也是产业关注的热点,来自学生的全新视角和多位资深产业人士的碰撞,能够碰撞出哪些新思路?


图片2.png

 

DeeCamp学员探索生命科学未解难题

 

DeeCamp人工智能训练营是创新工场发起的一项面向全球大学生的公益项目,专注培养应用型AI人才,迄今已经举办六届。

 

今年DeeCamp将AI应用聚焦于生命科学领域,当下这一时期也正是AI+生命科学从早期的技术积累逐渐过渡到价值验证阶段。

 

过去,制药行业到目前依然是效率最低的行业之一,也是信息技术难以颠覆的行业,但AI技术对生物技术的改革依然势不可挡。AI已经开始渗透到药物研发的各个环节,包括虚拟筛选、分子生成、靶点发现、ADMET预测、药物重定向、化合物合成等药物发现阶段。

 

有很多专家认为,AI将构建医疗行业的全新革命。DeeCamp的参赛学员们则为这场全新革命带来了新想象。

 

其中,获得总冠军的ProteinMiner挑战蛋白质组学信息发现。

 

蛋白质测序是人类理解生命活动,并对之进行调控的最重要的环节之一,虽然基因测序已经日渐成熟,但蛋白测序还缺乏高通量的测序技术。与此同时,传统分析方法依赖已有蛋白质序列数据库信息,无法分析全新的蛋白质或者抗体,蛋白质从头测序的需求应运而生。

 

ProteinMiner立足于AI与大数据驱动的蛋白质的质谱测序技术,致力于提升大规模地发现未知的蛋白序列与结构信息的能力。ProteinMiner提出预训练的AI谱图语言大模型,提升质谱从头测序的精度,加速免疫相关的新抗原/抗体的发现,以推动个性化免疫治疗的进程。此外,ProteinMiner提出谱图分类深度模型,实现快速的交联质谱数据的鉴定,构建实验数据支撑的组学规模的蛋白质空间距离信息数据库。


图片1.png

 

对于产业界未能解决的难题,DeeCamp的学员们通过AI技术探索突破口;在另一个维度上,DeeCamp学员们也创想通过AI为现有的解决方案降本增效。

 

以镁伽科技为产业导师的InfGene团队为例,InfGene探索基于代表性基因集的全基因组表达预测技术,这支由海内外高校成员组成的复合团队通过算法计算减少必须的基因组检测次数使用。

 

这一技术旨在减少超高通量测量的成本。全基因组表达谱的数据需要测量人类20000多个基因的转录表达水平,超高通量的检测造成较高的成本。事实上,人类基因表达之间存在高度的关联,不同基因的表达水平之间存在相互推算的可能。

 

在这一理论基础上,美国国立卫生研究院(NIH)启动了LINCS计划,推出了低成本转录组检测技术L1000。

 

L1000技术就利用了基因表达之间的相关性,基于大规模的统计分析辨识出978个基因作为全基因组的标志基因(landmark genes),通过测量标志基因的表达量,可以推算出其余20 000多个基因的表达量。

 

InfGene团队发现分形自编码器(FAE)可以选取相比 L1000 Panel 更加精简的代表性基因集作为特征,在XGBoost模型上达到比L1000 Panel更优的全基因组表达预测表现。该方法有望进一步节约大规模测量成本,形成可专利的新Panel,并拓展应用至建立组织特异性Panel,推动精准医疗。


基因.png


对于未来,来自这些学员的探索在产业探索中有多大的作用?

 

镁伽科技生物计算平台总监吴琼博士表示:“本次大赛,我们收获了很多创意和启发。InfGene团队的成员拥有生物学和计算机科学交叉背景。短短一个月内,他们大胆探索了多种基因集选取方法,比较了深度学习与传统的数据处理算法,并成功从中筛选出了一个最优方案。虽然成果有待实际应用中进一步验证,但在大规模药物筛选的应用背景下,具有潜在商业转化价值和可专利性,同时在未来还可以拓展到更多有价值的科学问题中,如疾病核心调控基因的发现,跨组学模态的表达预测等,为企业和科研机构提供方法参考。”

 

交叉创新成为产学研融合新范式

 

在AI+生命科学领域,阻碍行业高速发展的一大瓶颈就是复合型人才培养难度大,复合型人才培养困难。

 

DeeCamp在2017年由创新工场发起,从最初小规模的实验性训练营,到今天每年培训几百名来自高校的AI+人才,旨在为学生提供技术学习、工程实践、产品转化和商业思考的完整过程,推进产学研深度结合。

 

六年来,DeeCamp为中国AI应用型人才的培养搭建了一块试验田,来自产业、资本、顶级专家的授课为学员的创意提供丰厚的生长营养,为产业输送新鲜血液。不少学员去了顶尖的科技企业或者科研机构,把掌握到的技术“学以致用”。

 

六年间,DeeCamp获得了多位顶级学者和专家的支持,李开复、张亚勤、陈润生、吴恩达、张宏江、周明、周志华、周耀旗、马维英、高欣等名师亲自授课,讲解当下全球AI领域热点研究方向,以及“AI+”的未来机遇与挑战,同时涉猎AI技术产品落地、AI赋能时代的投资与创业等技术商业化思考。

 

举办DeeCamp六年以来,DeeCamp已累计收到2万余名在校大学生报名,录取并培养了1500余名学员,是目前规模最大、周期最长、最具特色的AI公益训练营。在国内外AI学子心中,DeeCamp训练营也建立起良好的口碑。

 

在DeeCamp连续举办六届的背后,是创新工场对AI领域人才的持续陪伴。创新工场作为国内领先的技术型创业投资机构,不止是为企业提供资金“弹药”,更是用“VC+AI”深度科技赋能的模式,陪伴高科技创业者成长壮大。

 

随着生命科学行业发展不断升级,AI、数字化、自动化等跨界技术不断重塑行业发展业态,行业越来越需要真正懂交叉技术、懂跨界产业的复合性投资人耐心陪伴创业者成长。

 

在AI+生命科学领域,创新工场紧密链接产业界、学术界与资本界。瞄准生命科学领域尚未被解决的问题,从源头出发培养、孵化能够解决技术难题和行业痛点的创新团队,从技术产品化到产品商业化,从企业融资到高端人脉资源补强等维度为创业者提供生态内的重要资源。

 

DeeCamp也搭建起一道产业界与高校间人才沟通培养的桥梁,数十家顶尖企业、机构参与到其中,提供了宝贵的课题资源、案例资源以及导师资源。

 

作为本届DeeCamp的战略合作伙伴,镁伽科技是生命科学自动化智能化领域的领先者,一直致力于提升生命科学研发和生产的效率。镁伽科技从创立之初就开始布局在生命科学领域的应用,借助人工智能和机器人自动化的技术基底,打造“自动化+人工智能+生物学”的能力闭环,不断在生命科学领域进行边界探索,加速生命科学相关领域的前沿突破和科技创新,为改进人类生命健康尽一份力量。

 

在此次合作中,镁伽科技提供了丰富的课题资源和导师资源。镁伽科技创始人兼首席执行官黄瑜清先生表示:“非常高兴此次镁伽能作为战略合作伙伴参与DeeCamp2022,与全球顶尖AI和生命科学领域的菁英们共同探索前沿科技为推动人类健康进步带来的可能性。众所周知,生命科学已经发展成为数据驱动的学科,人工智能正在改变生命科学领域的‘游戏规则’。而镁伽一直把数据作为核心资产,为算法的数据收集设计相关实验,并利用大规模自动化实验平台产生数据。此次DeeCamp2022,镁伽借助在生命科学智能自动化领域多年积累的技术经验和数据优势,邀请相关领域的资深科学家与同学们进行深度交流和智慧碰撞。未来,希望同学们能以DeeCamp2022的这次经历作为起点,为推动中国AI+生命科学的进阶贡献更多力量!”

 

如何提升生物学实验的可重复性和可预测性,是提高产业研发生产力的关键。人工智能技术与生命科学行业的碰撞,为生物技术领域带来新变革。DeeCamp2022中学员展现的想象力与智慧展现了AI+生命科学行业的活力,尽管在用AI设计药物方面还有很长的路要走,但相信未来在各界的努力下,算法会更加完善,AI在生命科学领域将发挥更大的作用。

 

创新工场董事长兼CEO、HICOOL商学院荣誉院长李开复博士表示,AI+科学交叉是创新工场预测未来5到10年间会引爆的创新增长新范式,AI+生命科学更是造福人类、影响深远的黄金赛道。这也是6年来一贯倡导“学以致用”的DeeCamp首次聚焦AI+生命科学这一命题的深意所在。这次入围总决赛的6支团队都是由AI和生命科学相关专业的优秀同学组成,在顶尖科研、产业导师指导下,在蛋白质结构预测、全基因组表达预测等各种场景进行探索,挑战了多个真实世界的难题。很高兴决赛同学在这次大赛中脱颖而出,期待在不久的将来,成为中国“AI+生命科学”赛道的创新先锋。我期许有志创业的DeeCamp同学,也可以把这次的项目实践视为产业价值的初步探索,同时关注帮助高科技创业者的北京HICOOL创业大赛及HICOOL商学院的丰富资源。

文章标签 人工智能
注:文中如果涉及企业数据,均由受访者向分析师提供并确认。
声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

杨雪

作者微信:hhhh333yyyy

分享
动脉橙
以上数据来自动脉橙产业智库

我们以独创的在线数据库方式,为健康产业人士提供全方位和实时的市场资讯、行业数据和分析师见解。现已覆盖数字健康、医疗器械、生物医药等近500+细分赛道,涉及公司名单、招投标、投融资信息、头部企业动态等各类数据并持续更新。

点击 【申请试用】了解动脉橙产业智库更多内容。
精彩内容推荐

最早的一批医疗大模型,已经走到了商业化时期

除了司美格鲁肽,我们还能靠什么?

“焦虑”的医疗信息化人,都去了深圳

佗道医疗两款产品接连拿证,手术机器人行业劲旅浮出水面

杨雪

共发表文章382篇

最近内容
  • 京津冀“3+N”集采结果公布!中天医疗借助集采中标实现跨越式增长

    2024-04-22

  • 28类耗材集采结果公布,强生、史赛克等丢标,百亿市场格局改写

    2024-03-20

  • 眼科百亿重磅单品获批,眼视光市场逻辑改写

    2024-03-13

上一篇

两年融资超15亿,疫情下爆发的心理健康赛道做对了什么

2022-09-04
下一篇

热度上升最快,“再生医美”能否复制玻尿酸造富神话?

2022-09-05