Avsnitt

  • 这期节目我们围绕蛋白质设计进行探讨。从传统的Rosetta到革命性的AlphaFold,我们见证了蛋白质设计技术的飞速发展。节目中,我们主要围绕蛋白质设计的领军人物David Baker实验室的最新研究成果,详细讲解了从序列优化到从头设计等核心概念,以及当前主流的设计模型和方法。

    伴随着RFdiffusion等新技术的发展应用,AI蛋白质设计可能会变得更加精确和高效,也许不远的将来我们就可以像使用Midjourney一样,通过简单的提示词来设计蛋白质。

    虽然目前还面临着很多挑战,AI驱动的蛋白质设计正在快速改变生物技术领域的格局,同时随着在蛋白疗法领域的深入应用,个性化医疗、新型疫苗研发等人类医疗健康领域也正在发生着革命性的改变。

    【嘉宾介绍】

    麒麟博士

    博士毕业于墨尔本大学,目前在国内一家新型研发机构进行助理研究员研究工作,主要从事AI药物研发以及相关算法开发,之前在一家Biotech公司担任计算生物科学家。

    【主要话题】

    02:33 蛋白质设计的发展历程,Rosetta的简单介绍及Rosetta和Alphafold的主要区别

    06:48 蛋白质序列优化与从头设计(De novel)

    10:15 一些常见名词介绍:unconditional design, binder or enzyme design, multi-motif scaffolding

    12:36 蛋白质序列设计的主流模型

    13:57 从蛋白质设计的计算结果到实验室环境的挑战

    16:21 蛋白质设计的成功率问题

    19:59 关于RFdiffusion的讨论,我们可以像用midjourney一样prompt蛋白质出来吗

    24:24 蛋白质设计的功能目标以及分别在什么情况下可以进行优化或需要重新设计

    28:18 ADA(antidrug antibodies)

    30:29 蛋白质疗法的简单介绍,小型蛋白的最新发现

    36:48David Baker组和DeepMind的两种路线以及对行业的一些讨论(最后3分钟有主播lotus和嘉宾的个人观点小彩蛋)

    【Reference】

    AI+蛋白质行业研究报告

    下面是希望了解更多蛋白质设计及蛋白疗法的一些论文指路:

    Designed endocytosis-inducing proteins degrade targets and amplify signals

    设计的内吞诱导蛋白降解靶标并放大信号,介绍了新型的蛋白质设计方法,通过创建能够诱导细胞内吞作用的EndoTags来特异性降解细胞表面受体,并显著增强信号传导

    Improved protein binder design using beta-pairing targeted RFdiffusion

    利用β配对靶向RF扩散改进蛋白质结合剂设计,通过条件RFdiffusion生成与目标蛋白质边缘β-链形成几何匹配的扩展β-片层的蛋白质框架,以设计出对极性蛋白质目标具有高亲和力的蛋白质结合剂

    Target-conditioned diffusion generates potent TNFR superfamily antagonists and agonists

    目标条件扩散产生有效的TNFR超家族拮抗剂和激动剂,通过目标条件扩散技术设计出针对TNF受体超家族的高亲和力拮抗剂和激动剂

    Tuning insulin receptor signaling using de novo designed Agonists

    使用从头设计的激动剂调节胰岛素受体信号传导,通过计算设计合成激动剂来调节胰岛素受体信号,在治疗糖尿病和胰岛素抵抗综合征方面展现出治疗潜力

    Preclinical proof of principle for orally delivered Th17 antagonist miniproteins

    通过计算设计方法开发能够口服给药的Th17拮抗剂小型蛋白(minibinders),特别是针对IL-17A和IL-23R的拮抗剂

    Design of protein-binding proteins from the target structure alone

    从目标蛋白的三维结构出发,设计能够与其特定位点结合的蛋白质的方法,这些设计蛋白具有高稳定性和纳摩尔至皮摩尔级别的亲和力。

    De novo protein design by deep network hallucination

    通过深度网络幻觉进行从头蛋白质设计

    Scaffolding protein functional sites using deep learning

    介绍了两种基于深度学习的方法,用于在不预设蛋白质折叠或二级结构的情况下,设计包含特定功能位点的蛋白质,这些方法成功设计了多种具有免疫原性、受体陷阱、金属结合和酶活性的蛋白质候选物。

    欢迎在评论区留言交流。想要了解更多每日AI与生物科技前沿的讨论与分享,可以关注小红书:

    各类合作或嘉宾自荐,请添加微信:Lostu_wd

  • 我们在这档节目中一直在尝试解读并想象人工智能在生物医药领域重新定义探索科学的方式,本期我们将聚焦于通过图学习在解读复杂生物分子世界中的应用。

    图模型由于其特殊的结构可以反映分子的空间结构和化学键关系,天然适合用来表示分子数据,并可以非常高效地处理这些非结构化数据。本期嘉宾会从实际应用的角度,深入探讨图模型在多模态数据融合中的应用,以及如何通过预训练图模型来提高性能。

    如果你想要进一步了解图模型或AI4Science,可以下滑参考嘉宾推荐的一些在AI for science领域值得关注的研究人员和项目。

    听前提醒:本期会有大量模型及数据相关英文名称,有一定机器学习或生物计算背景的知识的话听起来会比较轻松,也可以参考下面shownotes中对于一些图学习概念的简单介绍

    【嘉宾介绍】

    Camille, 香港中文大学CS PHD博士在读

    研究方向:AI4Science and Graph Learning

    【主要话题】

    02:53 什么是图模型以及不同架构图模型的简单介绍

    10:03 图模型与AI4Science领域其他模型相比的优势以及

    12:14 GNN v.s. transformer在不同类型任务中的应用

    14:03 Graph-based model 适合的计算场景

    15:37 目前AI4Science领域中值得关注的模型:EGNN,Equiformer

    17:00 Alphafold建模序列后是否可以使用图进行结构化的训练及预测?目前都有哪些进展?

    22:18 除了蛋白质计算外还有哪些场景可以利用图模型?

    24:42 基于图的模型与基于序列sequence的模型相比,在训练上有什么难点?

    26:25 我们如何解决图数据中的噪声和不确定性?

    27:40 针对图学习中多模态融合,在蛋白计算中如何将序列信息(如氨基酸序列)与结构信息结合?

    27:29 图数据中存在数据截断的挑战吗?需要的算力如何?

    32:41 基于图的diffusion model和传统的diffusion model有什么区别?

    34:38 大规模预训练图模型的进展和挑战,图模型中的scaling law

    38:29 图模型值得关注的研究和机构

    42:02 AI模型在DNA及RNA研究中的应用

    44:58 对想要入门AI4Science领域的人,有哪些推荐的学习资源

    【Glossary】

    encode:计算机的"翻译官"或"转换器",将特征转换成数学语言;原始数据可能是:分子中的原子类型,社交网络中的用户特征或是蛋白质中的氨基酸信息,而encode要做的是:把这些特征转换成数学语言(向量),让计算机能够理解和处理,并保留原始数据中重要的信息 message passing:图模型中的“邻里信息交流会”,每个居民(节点)都有自己的信息,大家互相分享信息(message passing),最终每个人综合邻居的信息更新自己的认知,每个节点既是信息发送者也是接收者 over-smoothing:过度平滑,在深度图神经网络中,随着层数增加,不同节点的特征表示会逐渐变得相似,最终趋于一个相同的值。这种现象类似于信息的"过度混合",导致节点失去独特性,使得模型难以区分不同节点的特征,从而影响预测性能。 Hop:hop就是在图中从一个节点到另一个节点需要"跳跃"的次数。这个概念在图神经网络中决定了信息传递的范围,用社交网络的例子:

    1-hop:你的直接好友

    2-hop:朋友的朋友

    3-hop:朋友的朋友的朋友

    backbone:图模型的基本架构,用于处理节点和边的基本信息,然后再添加其他模块来增强功能,基础的GNN类型架构包括:GCN (Graph Convolutional Network),GAT (Graph Attention Network),GraphSAGE等 Surrogate model:通过对原始模型的输入-输出关系进行学习,构建一种数学近似模型,用于模拟更复杂系统的行为,在精度和效率之间寻找平衡 拓扑信息:在图数据中,拓扑信息就像一张"关系地图",记录了图中的连接关系(谁和谁相连,连接的强度和方向),结构特征(节点的连接数,重要程度等),以及全局特征(包括网络密度,层次关系和社区结构等)

    【Reference】

    英矽智能:深度学习驱动的新药研发取得里程碑式突破

    研究者推荐:

    Jure Leskovec:斯坦福大学计算机科学系的教授,研究领域主要是应用于大型互联系统中的机器学习,专注于对各种规模系统的复杂、丰富标签的关联结构、图和网络进行建模,从细胞中蛋白质的相互作用到社会中人类之间的相互作用 Yoshua Bengio:蒙特利尔大学的全职教授,同时也是 Mila - 魁北克人工智能研究所的创始人兼科学总监。他作为高级研究员共同领导了 CIFAR 机器与大脑学习项目,并担任 IVADO 的科学总监

    个人主页:yoshuabengio.org

    Mila - 魁北克人工智能研究所

    唐建:加拿大魁北克省蒙特利尔市 Mila-Quebec 人工智能研究所和 HEC 蒙特利尔大学的副教授

    个人主页:jian-tang.com

    李子青:西湖大学人工智能讲席教授,IEEE Fellow,曾任微软亚洲研究院Research Lead,中科院自动化所模式识别国家重点实验室资深研究员 Quanquan Gu Le Song Junchi Yan

    相关论文及综述:

    Equiformer: Equivariant Graph Attention Transformer for 3D Atomistic Graphs

    GearNet: Protein Representation Learning by Geometric Structure Pretraining

    Scientific discovery in the age of artificial intelligence

    详解了自监督学习、几何深度学习、生成式人工智能等技术在科学研究中的应用,并提出了目前AI跨界仍存在的核心问题,目前该论文已刊于Nature综述文章

    Diffusion Models: A Comprehensive Survey of Methods and Applications

    三大会议:

    International Conference on Machine Learning (ICML)

    Annual Conference on Neural Information Processing Systems (NeurIPS)

    International Conference on Learning Representations (ICLR)

    更多资料见:AI for Science paper collection

    欢迎在评论区留言交流。想要了解更多每日AI与生物科技前沿的讨论与分享,可以关注小红书:

    各类合作或嘉宾自荐,请添加微信:Lostu_wd

  • Saknas det avsnitt?

    Klicka här för att uppdatera flödet manuellt.

  • 这一期我们尝试围绕当代人非常关心的话题 —「衰老」进行一些探讨。

    细胞衰老作为整体生物衰老的基础,在衰老过程中起关键作用。我们从细胞衰老的多种类型切入,讨论细胞死亡机制的研究进展,以及衰老标记物帮助我们计算生物机体年龄的可能性。

    我们请教了嘉宾目前现代抗衰老的前沿研究和实际应用,包括通过药物诱导衰老细胞死亡的策略,干细胞疗法,二甲双胍等药物在抗衰老方面的潜力。

    随着AI时代的来临,细胞衰老领域依然面临着数据匮乏等困难,借助大模型的力量也许可以帮助挖掘衰老的标志物和靶点,从而推动抗衰老药物的开发。

    【嘉宾介绍】

    蜗牛博士

    毕业于清华大学,专注于肿瘤生物学和细胞死亡机制的研究

    【主要话题】

    02:47 细胞衰老和机体衰老的区别与联系

    06:53 细胞衰老的类别以及细胞死亡机制的简单介绍

    10:19 细胞死亡是清除衰老细胞,或者说抗衰老的思路之一

    11:30 衰老相关疾病阿尔兹海默症与amyloid-beta 蛋白

    16:13 通过生物标记物确定人体生物机体年龄的可能的方式

    19:21 跟年轻的儿子换血真的能抗衰老?

    21:39 真的想抗衰老的话只需要做两件事情:少吃,以及二甲双胍?

    23:45 价格低廉的衰老药物以及其商业化价值是否会有冲突?

    26:27 衰老机制的研究还有许多不明确的地方

    28:07 防晒是为了避免DNA损伤诱导的细胞衰老,压力过大可能真的会“一夜白头”

    31:26 抗炎以及干细胞,真的能抗衰老吗?

    39:12 AI在衰老研究领域面临的数据匮乏困境与可能的方向

    44:34 肠道是衰老最先发生的地方

    46:4 人类断崖式衰老的两个年龄节点:44岁和60岁

    【Reference】

    中国科学院团队针对二甲双胍在食蟹猕猴上的临床实验

    * 封面配图来自该论文配图

    science一篇针对衰老领域研究发展方向的讨论

    Senolytics从药物抑制剂到免疫治疗的应用

    【Glossary】

    细胞衰老 (Cellular Senescence):细胞衰老是指细胞因多种因素(如DNA损伤、复制能力下降等)而进入一种永久性的细胞周期终止状态,不再进行分裂,但仍然存活并执行一些功能。 机体衰老 (Organismal Senescence):机体衰老是指整个生物体随时间推移而发生的多系统器官功能减退的过程,通常伴随着对环境压力适应能力的减弱、疾病易感性的增加以及死亡率的上升。 端粒 (Telomeres):端粒是位于染色体末端的重复序列DNA,它们保护染色体不受损害。随着细胞分裂,端粒逐渐缩短,当端粒长度减少到一定程度时,细胞将进入衰老状态。 DNA损伤诱导的细胞衰老 (DNA Damage-Induced Senescence):指细胞因DNA受到损伤(如紫外线照射、化学物质等)而超出细胞修复能力,导致细胞进入衰老状态。 氧化应激诱导的细胞衰老 (Oxidative Stress-Induced Senescence):指细胞因暴露于高浓度的氧化剂(如过氧化氢)而无法维持正常的氧化还原平衡,导致细胞功能受损,进而发生衰老。 化疗药物诱导的细胞衰老 (Chemotherapy-Induced Senescence):指某些化疗药物在治疗癌症的过程中,可能诱导正常细胞或癌细胞进入衰老状态。 衰老标志物 (Senescence Markers):衰老标志物是指与细胞衰老相关的分子,可以用于检测和研究衰老过程,如β-半乳糖苷酶(SA-β-gal)活性的增加。 衰老细胞裂解剂 (Senolytic Agents):指能够选择性地清除衰老细胞的药物或化合物,通过诱导衰老细胞死亡来达到抗衰老的效果。 二甲双胍 (Metformin):一种常用于治疗2型糖尿病的药物,近年来研究发现它可能具有抗衰老的效果。 雷帕霉素 (Rapamycin):一种免疫抑制剂,用于器官移植后的抗排斥反应,同时也被发现具有延长某些生物寿命的潜力。 多组学数据 (Omics Data):指从不同生物层面(如基因组、转录组、蛋白质组、代谢组)收集的数据,用于全面理解生物系统的复杂性。

    欢迎在评论区留言交流。想要了解更多每日AI与生物科技前沿的讨论与分享,可以关注小红书:

    各类合作或嘉宾自荐,请添加微信:Lostu_wd

  • 这期节目的选题原本是来源于对我们对这两位在学术和精神领域都可以称得上先驱的大佬的敬仰观察。化学诺奖公布的时候感觉很奇妙,第一个想法就是这一期必须得录了。

    我们从观察者的视角试图讨论蛋白质结构预测的前夜与突破,为什么说alphafold很牛,以及被称为“上帝之手”的蛋白质设计第一人。

    你还会听到一些关于AI工具与个体科学家的关系,开源与商业化的选择,科技突破的条件等延展讨论。

    回到这个节目的初心,我们希望让更多的人才从“在沉浸流里看多几个广告策略”中抬头看看,了解更多基础科学正在塑造我们身边真实世界的方式,生物计算作为此次大模型浪潮中发展最为快速的应用领域之一,有无限的想象空间和极大的人才缺口,希望可以埋下一颗种子,让更多人优秀人才积极投身于该领域的发展中。


  • 第一期邀请到了我们的好朋友Alex陈博士,作为一个结构生物学研究者,Alex目前就职于一家国内专注于提供生物计算大模型的公司负责蛋白设计相关的研究工作。

    蛋白质的序列和结构如何决定了它的功能?蛋白质计算到底是在算什么?

    AI在药物发现链条中可能可以担任怎样的角色?真正的AIDD(AI drug discovery)离我们还有多远?

    Alphafold等生物计算模型是如何运作的?

    蛋白质计算在合成生物学领域的发展现状和未来方向。

    除了以上生物科技领域相关的问题,我们还讨论了中美目前生物科技行业的发展选择和目前面临的资金困境。


    欢迎大家在评论区留言交流,如果觉得本期节目对你有所启发或收获,请在你喜马拉雅,小宇宙或其他你使用收听的平台留下你的宝贵好评。


    商务合作&嘉宾自荐请添加微信: Lostu_wd