每年,nature杂志都会对新一年值得关注的技术进行预测,今年1月22日,nature发布了本年度值得关注的7个技术领域,其中3个与合成生物学有关。它们分别是:

蛋白质设计的深度学习

二十年前,西雅图华盛顿大学的大卫·贝克( David Baker)和他的同事实现了一项里程碑式的壮举:他们使用计算工具从头开始设计了一种全新的蛋白质。“Top7”按照预测折叠,但它是惰性的——即没有执行任何有意义的生物学功能。如今,从头蛋白质设计已经成熟成为一种用于生成定制酶和其他蛋白质的实用工具。华盛顿大学生物化学家尼尔·金 (Neil King,他与贝克的团队合作设计基于蛋白质的疫苗和药物输送载体) 表示:“这具有巨大的意义,一年半前这是不可能的事情,现在可以做到了。”

这些进展很大程度上归功于将蛋白质序列与结构联系起来的日益庞大的数据集。但复杂的深度学习方法(人工智能 (AI) 的一种形式)也至关重要

“基于序列”的策略使用大型语言模型 (LLM),该模型为聊天机器人 ChatGPT 等工具提供支持。通过像包含多肽“单词”的文档一样处理蛋白质序列,这些算法可以辨别真实世界蛋白质的架构手册背后的模式。“他们真正学习了隐藏的语法,”西班牙巴塞罗那分子生物学研究所的蛋白质生物化学家诺埃莉亚·费鲁兹 (Noelia Ferruz) 说。2022 年,她的团队开发了一种名为 ProtGPT2 的算法,该算法始终能够产生在实验室生产时稳定折叠的合成蛋白质。Ferruz 共同开发的另一个工具称为 ZymCTRL,它利用序列和功能数据来设计天然存在的酶家族的成员。

基于序列的方法可以建立并调整现有的蛋白质特征以形成新的框架,但它们对于结构元件或特征的定制设计效果较差,例如以可预测的方式结合特定靶标的能力。基于结构”的方法在解决这些问题上做的更好一点2023 年这种类型的蛋白质设计算法也取得了显著进展。其中一些最复杂的模型使用“扩散”模型,该模型也是 DALL-E 等图像生成工具的基础。这些算法最初经过训练,可以从大量真实结构中消除计算机生成的噪声;通过学习区分现实的结构元素和噪音,他们获得了形成生物学上合理的、用户定义的结构的能力。

Baker 实验室开发的RFdiffusion 软件和马萨诸塞州萨默维尔的Generate Biomedicines 开发的 Chroma 工具利用这一策略取得了显着效果。例如,贝克的团队正在使用射频扩散来设计新型蛋白质,这些蛋白质可以与感兴趣的目标形成紧密的界面,从而产生“完全符合表面”的设计,贝克说。RFdiffusion的更新“全原子”迭代允许设计人员通过计算塑造围绕非蛋白质目标(例如 DNA、小分子甚至金属离子)的蛋白质。由此产生的多功能性为工程酶、转录调节剂、功能性生物材料等开辟了新的视野。


大片段的DNA插入

2023 年末,美国和英国监管机构批准了首个基于 CRISPR 的基因编辑疗法,用于治疗镰状细胞病和输血依赖性 β 地中海贫血,这是基因组编辑作为临床工具的重大胜利。

CRISPR 及其衍生物使用短的可编程 RNA 将 DNA 切割酶(例如 Cas9)引导至特定的基因组位点。它们通常在实验室中用于禁用有缺陷的基因并引入小的序列变化精确且可编程地插入跨越数千个核苷酸的较大 DNA 序列是很困难的,但新兴的解决方案可以让科学家替换有缺陷基因的关键片段或插入功能齐全的基因序列。

加州斯坦福大学的分子遗传学家 Le Cong 和他的同事正在探索单链退火蛋白 (SSAP)——一种介导 DNA 重组的病毒衍生分子。当与 Cas9 DNA 切片功能已被禁用的 CRISPR-Cas 系统结合使用时,这些 SSAP 可以将多达 2 KB 的 DNA 精确定向插入人类基因组中。

其他方法利用基于 CRISPR 的方法(称为“引物编辑”)引入短“着陆垫”序列,选择性地招募酶,从而将大 DNA 片段精确拼接到基因组中。例如,2022 年,剑桥麻省理工学院的基因组工程师 Omar Abudayyeh 和 Jonathan Gootenberg 及其同事首次描述了通过位点特异性靶向元件 (PASTE) 进行可编程添加,这是一种可以精确插入多达 36 KB DNA 的方法 。Cong 表示,PASTE 对于培养的、源自患者的细胞的离体修饰特别有前景,并且底层的 Prime 编辑技术已经步入临床研究的轨道。但对于人体细胞的体内修饰,SSAP 可能提供更紧凑的解决方案:体积更大的 PASTE 机器需要三个独立的病毒载体进行传递,这可能会降低相对于双组件 SSAP 系统的编辑效率。也就是说,即使相对低效的基因替代策略也足以减轻许多遗传疾病的影响。

这些方法不仅与人类健康相关。北京中国科学院高彩霞领导的研究人员开发了PrimeRoot,这是一种使用prime编辑引入特定目标位点的方法,酶可以使用这些位点在水稻和玉米中插入多达20个碱基的DNA 。高认为,该技术可广泛用于赋予作物抗病和抗病原体能力,持续推动基于CRISPR 的植物基因组工程的创新浪潮。“我相信这项技术可以应用于任何植物物种,”她说。


细胞图谱

如果您要寻找一家咖啡馆,可以使用Google 地图进行路线导航。但目前还没有类似的方法可以导航更复杂的人体景观,但在单细胞分析和“空间组学”方法的进步的推动下,各种细胞图谱计划的持续进展,对人类来说,这将对致病基因,疾病机制了解,药物发现,疾病诊断等方面产生深远影响。

这些计划中最大的是人类细胞图谱(HCA。该联盟由英国欣克斯顿 Wellcome Sanger 研究所的细胞生物学家 Sarah Teichmann 和加利福尼亚州南旧金山生物技术公司 Genentech 现任研究和早期开发负责人 Aviv Regev 于 2016 年发起。它由来自近 100 个国家的约 3,000 名科学家组成,使用来自 10,000 名捐赠者的组织进行工作。但 HCA 也是更广泛的交叉细胞和分子图谱工作生态系统的一部分。其中包括人类生物分子图谱计划 (HuBMAP) 和通过推进创新神经技术 (BRAIN) 倡议细胞普查网络 (BICCN) 进行的脑研究 (BICCN),均由美国国立卫生研究院资助,以及艾伦脑细胞图谱 (Allen Brain Cell Atlas,由美国国立卫生研究院资助,位于华盛顿州西雅图的艾伦研究所)。

斯坦福大学基因组学家、HuBMAP 指导委员会前联合主席 Michael Snyder 表示,这些努力在一定程度上是能够推动在单细胞水平解码分子内容的分析工具的开发和快速商业化的。例如,Snyder 的团队经常使用加利福尼亚州普莱森顿 10X Genomics 的 Xenium 平台进行空间转录组学分析。该平台可以每周在 4 个组织样本中同时调查大约 400 个基因的表达。另一个例子是:马萨诸塞州马尔伯勒 Akoya Biosciences 的 PhenoCycler 平台,它们使用基于多重抗体的方法,使团队能够以单细胞分辨率以支持 3D 组织重建的格式跟踪大量蛋白质。其他“多组学”方法使科学家能够同时分析同一细胞中的多个分子类别,包括RNA 的表达、染色质的结构和蛋白质的分布。

人肺细胞图谱描述了不同的细胞类型及其调节方式。图片来源:nature

去年,数十项研究展示了使用这些技术生成器官特异性图谱的进展。例如,6 月份,HCA 发布了对人肺 49 个数据集的综合分析。Teichmann 说:“有了非常清晰的肺部地图,可以了解肺纤维化、不同肿瘤、甚至 COVID-19 等疾病发生的变化。” 2023 年,《Nature》发布了一个文章集(参阅1),重点介绍了 HuBMAP 的进展,《Science》则制作了一个文章集,详细介绍了 BICCN 的工作(参阅2)。

现在仍有大量工作要做,Teichmann 估计 HCA 至少需要五年才能完成。但最终的地图在到达时将是无价的。例如,Teichmann 预测使用图谱数据来指导组织和细胞特异性药物靶向,而 Snyder 则渴望了解细胞微环境如何告知癌症和肠易激综合症等复杂疾病的风险和病因。“我们可能不能在2024年解决这个问题,这是一个持续多年的问题,但不可否认它是整个领域的一大推动力。”斯奈德说。


其他值得关注的技术
▶ 脑机接口

帕特·贝内特的说话速度比一般人慢,有时会用错词。但考虑到运动神经元疾病(也称为肌萎缩侧索硬化症)此前曾导致她无法用语言表达自己的意思,这是一项了不起的成就。

Bennett 的康复得益于斯坦福大学神经科学家 Francis Willett 及其美国 BrainGate 联盟的同事开发的复杂脑机接口 (BCI) 设备。威利特和他的同事在贝内特的大脑中植入电极来跟踪神经元活动,然后训练深度学习算法将这些信号转化为语音。经过几周的训练,贝内特每分钟能够说出多达 62 个单词,词汇量为 125,000 个单词,是普通英语使用者词汇量的两倍多。“他们的沟通速度确实令人印象深刻,”宾夕法尼亚州匹兹堡大学开发 BCI 技术的生物工程师 Jennifer Collinger 说道。


脑机接口技术让帕特·贝内特(Pat Bennett)(坐)重新恢复了说话能力。图片来源:Steve Fisch/斯坦福大学医学院

BrainGate 的试验只是过去几年中的几项研究之一,这些研究展示了脑机接口技术如何帮助患有严重神经损伤的人重新获得失去的技能并获得更大的独立性。罗德岛州普罗维登斯布朗大学神经学家、BrainGate 联盟主任 Leigh Hochberg 表示,其中一些进展源于对患有各种神经系统疾病的个体大脑中功能性神经解剖学知识的不断积累。但他补充说,通过机器学习驱动的分析方法,这些知识已经被大大放大,这些方法揭示了如何更好地放置电极并解密它们接收到的信号。
研究人员还应用基于人工智能的语言模型来加速对患者试图交流的内容的解释——本质上是大脑的“自动完成”。这是 Willett 的研究的核心部分,也是加州大学旧金山分校神经外科医生 Edward Chang 领导的团队的另外11项研究的核心部分。在这项工作中,BCI 神经假体让一名因中风而无法说话的女性能够以每分钟 78 个单词的速度进行交流——大约是英语平均速度的一半,但比该女性之前的语言辅助速度快了五倍多设备。该领域在其他领域也取得了进展。2021 年,科林格和匹兹堡大学的生物医学工程师罗伯特·冈特 (Robert Gaunt) 将电极植入四肢瘫痪者的运动和体感皮层中,以提供对机械臂的快速、精确控制以及触觉反馈。BrainGate 和荷兰 UMC Utrecht 的研究人员进行的独立临床研究以及纽约布鲁克林 BCI 公司 Synchron 的一项试验也在进行中,该试验旨在测试一种允许瘫痪者控制计算机的系统——这是首个允许瘫痪患者控制计算机的系统。业界赞助的 BCI 装置试验。
作为一名重症监护专家,霍赫伯格渴望将这些技术提供给患有最严重残疾的患者。但随着脑机接口功能的发展,他看到了治疗中度认知障碍以及情绪障碍等心理健康状况的潜力。“由脑机接口提供信息的闭环神经调节系统可能会给很多人带来巨大的帮助,”他说。
▶ 深度换脸检测
公开可用的生成人工智能算法的爆炸式增长使得合成令人信服但完全人工的图像、音频和视频变得简单。结果可能会带来有趣的干扰,但随着多重地缘政治冲突的持续和美国总统选举的临近,武器化媒体操纵的机会比比皆是。
纽约布法罗大学的计算机科学家 Siwei Lyu 表示,他看到了大量由人工智能生成的与以色列-哈马斯冲突相关的“深度伪造”图像和音频。这只是一场高风险的猫鼠游戏的最新一轮,人工智能用户制作欺骗性内容,Lyu 和其他媒体取证专家致力于检测和拦截它。
一种解决方案是生成人工智能开发人员在模型的输出中嵌入隐藏信号,从而生成人工智能生成内容的水印。其他策略侧重于内容本身。例如,一些经过处理的视频将一个公众人物的面部特征替换为另一个公众人物的面部特征,而新算法可以识别被替换特征边界处的人工制品。一个人外耳的独特褶皱也可以揭示面部和头部之间的不匹配,而牙齿的不规则性可以揭示编辑过的口型同步视频,在视频中,一个人的嘴被数字化操纵,说出了受试者没有说的话。人工智能生成的照片也提出了一个棘手的挑战——以及一个不断变化的目标。2019 年,意大利那不勒斯费德里科二世大学媒体取证专家 Luisa Verdoliva 帮助开发了 FaceForensics++,这是一种由多个广泛使用的软件包操纵的面部识别工具。但图像取证方法是特定于主题和软件的,泛化是一个挑战。
然后是实施方面的挑战。美国国防高级研究计划局的语义取证 (SemaFor) 计划开发了一个用于深度伪造分析的有用工具箱,但是,正如《自然》杂志报道的那样(参见《自然》621、676–679;2023),主要社交媒体网站并未常规使用它。扩大对此类工具的访问范围可能有助于促进人们的使用,为此,Lyu 的团队开发了DeepFake-O-Meter ,这是一个集中式公共算法存储库,可以从不同角度分析视频内容以嗅出 Deepfake 内容。这些资源会有所帮助,但针对人工智能生成的错误信息的斗争可能会持续数年。
▶ 超级分辨率显微镜
Stefan Hell、Eric Betzig 和 William Moerner 因打破限制光学显微镜空间分辨率的“衍射极限”而荣获 2014 年诺贝尔化学奖。由此产生的细节水平(大约为数十纳米)开启了广泛的分子尺度成像实验。尽管如此,一些研究人员仍然渴望更好的结果——而且他们正在迅速取得进展。德国普拉内格马克斯·普朗克生物化学研究所的纳米技术研究员 Ralf Jungmann 表示:“我们确实在努力缩小超分辨率显微镜与冷冻电子显微镜等结构生物学技术之间的差距。”他指的是一种方法可以以原子级分辨率重建蛋白质结构。

哥廷根马克斯·普朗克多学科科学研究所的 Hell 和他的团队领导的研究人员于 2022 年末首次涉足这一领域,采用了一种名为MINSTED 的方法,使用专门的光学显微镜,该方法可以以 2.3 埃(大约1/4纳米)的精度解析单个荧光标记

较新的方法可提供与传统显微镜相当的分辨率。例如,Jungmann 和他的团队在 2023 年描述了一种策略,其中单个分子被不同的 DNA 链标记。然后用染料标记的互补 DNA 链检测这些分子,这些 DNA 链短暂但重复地与相应的目标结合,从而可以区分单个荧光“闪烁”点,如果同时成像,这些“闪烁”点会模糊成单个斑点。这种通过顺序成像 (RESI) 方法增强分辨率的方法可以解析 DNA 链上的单个碱基对,从而用标准荧光显微镜展示埃级分辨率。

由德国哥廷根大学医学中心的神经科学家 Ali Shaib 和 Silvio Rizzoli 领导的团队开发的一步纳米级扩展 (ONE) 显微镜方法并没有完全达到这一水平的分辨率。然而,ONE 显微镜提供了前所未有的机会,可以直接对分离的和细胞中的单个蛋白质和多蛋白质复合物的精细结构细节进行成像。

RESI 的艺术家印象图,显示附着在细胞膜蛋白质上的 DNA 链和突出显示两个相邻碱基的 DNA

一种称为 RESI 的成像形式可以对 DNA 中的单个碱基对进行成像。图片来源:马克斯·伊格莱西亚斯,马克斯·普朗克生物化学研究所

ONE 是一种基于膨胀显微镜的方法,涉及将样品中的蛋白质与水凝胶基质进行化学偶联,将蛋白质分解,然后使水凝胶的体积膨胀 1,000 倍。这些片段在各个方向上均匀扩展,保留了蛋白质结构,并使用户能够使用标准共聚焦显微镜解析间隔几纳米的特征。“我们取出抗体,将它们放入凝胶中,在膨胀后对其进行标记,然后说,“哦——我们看到了 Y 形!” 里佐利说,他指的是蛋白质的特征形状。
里佐利说,一种显微镜可以提供对构象动态生物分子的洞察,或者能够从血液样本中对帕金森病等蛋白质错误折叠疾病进行视觉诊断。Jungmann 同样热衷于 RESI 记录疾病中单个蛋白质重组或药物治疗反应的潜力。甚至可以放大得更紧密。“也许这还不是空间分辨率限制的终结,”荣格曼说。“情况可能会好起来。”
▶ 3D打印纳米材料
在纳米尺度上可能会发生奇怪而有趣的事情。这可能会使材料科学预测变得困难,但这也意味着纳米级建筑师可以制造具有独特特性的轻质材料,例如增加强度、与光或声音的定制相互作用以及增强的催化或能量存储能力。
存在多种精确制造此类纳米材料的策略,其中大多数使用激光来诱导光敏材料的图案化“光聚合”,并且在过去几年中,科学家在克服阻碍更广泛采用这些方法的限制方面取得了相当大的进展。

使用 3D 打印技术由铜制成的微型晶格结构

研究人员利用水凝胶制作了微型金属结构。图片来源:Max Saccone/Greer 实验室

一是速度。亚特兰大佐治亚理工学院的工程师 Sourabh Saha 表示,使用光聚合组装纳米结构的速度比其他纳米级 3D 打印方法大约快三个数量级。这对于实验室使用来说可能足够好,但对于大规模生产或工业过程来说太慢了。2019 年,Saha 和香港中文大学的机械工程师 Shih-Chi Chen 及其同事表明,他们可以通过使用图案化的 2D 光片而不是传统的脉冲激光器来加速聚合。“这将速率提高了一千倍,而且您仍然可以保持那些 100 纳米的特性,”Saha 说。包括陈在内的研究人员的后续工作已经确定了更快纳米制造的其他途径。
另一个挑战是并非所有材料都可以通过光聚合直接打印——例如金属。但帕萨迪纳加州理工学院的材料科学家朱莉娅·格里尔(Julia Greer)开发出了一种巧妙的解决方法。2022年,她和她的同事描述了一种以光聚合水凝胶作为微型模板的方法;然后将它们注入金属盐并以诱导金属呈现模板结构同时收缩的方式进行处理。尽管该技术最初是针对微米级结构开发的,但格里尔的团队也将这种策略用于纳米制造,研究人员对用坚固的高熔点金属和合金制造功能性纳米结构的潜力充满热情。
最后一个障碍,经济性,这可能是最难打破的。据 Saha 称,许多光聚合方法中使用的基于脉冲激光的系统成本高达 50 万美元。但更便宜的替代品正在出现。例如,德国卡尔斯鲁厄理工学院的物理学家 Martin Wegener 和他的同事探索了比标准脉冲激光器更便宜、更紧凑且功耗更低的连续激光器。格里尔还成立了一家初创公司,将纳米结构金属板的制造工艺商业化,该金属板可适用于下一代防弹衣或飞机和其他车辆的超耐用和抗冲击外层等应用。
资料来源:
[1] https://www.nature.com/collections/aihihijabe
[2] https://www.science.org/collections/brain-cell-census
[3] https://www.nature.com/articles/d41586-024-00173-x













点赞(0)

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部