每年,nature杂志都会对新一年值得关注的技术进行预测,今年1月22日,nature发布了本年度值得关注的7个技术领域,其中3个与合成生物学有关。它们分别是:
二十年前,西雅图华盛顿大学的大卫·贝克( David Baker)和他的同事实现了一项里程碑式的壮举:他们使用计算工具从头开始设计了一种全新的蛋白质。“Top7”按照预测折叠,但它是惰性的——即没有执行任何有意义的生物学功能。如今,从头蛋白质设计已经成熟成为一种用于生成定制酶和其他蛋白质的实用工具。华盛顿大学生物化学家尼尔·金 (Neil King,他与贝克的团队合作设计基于蛋白质的疫苗和药物输送载体) 表示:“这具有巨大的意义,一年半前这是不可能的事情,现在可以做到了。”
这些进展很大程度上归功于将蛋白质序列与结构联系起来的日益庞大的数据集。但复杂的深度学习方法(人工智能 (AI) 的一种形式)也至关重要。
“基于序列”的策略使用大型语言模型 (LLM),该模型为聊天机器人 ChatGPT 等工具提供支持。通过像包含多肽“单词”的文档一样处理蛋白质序列,这些算法可以辨别真实世界蛋白质的架构手册背后的模式。“他们真正学习了隐藏的语法,”西班牙巴塞罗那分子生物学研究所的蛋白质生物化学家诺埃莉亚·费鲁兹 (Noelia Ferruz) 说。2022 年,她的团队开发了一种名为 ProtGPT2 的算法,该算法始终能够产生在实验室生产时稳定折叠的合成蛋白质。Ferruz 共同开发的另一个工具称为 ZymCTRL,它利用序列和功能数据来设计天然存在的酶家族的成员。
基于序列的方法可以建立并调整现有的蛋白质特征以形成新的框架,但它们对于结构元件或特征的定制设计效果较差,例如以可预测的方式结合特定靶标的能力。基于结构”的方法在解决这些问题上做的更好一点,2023 年这种类型的蛋白质设计算法也取得了显著进展。其中一些最复杂的模型使用“扩散”模型,该模型也是 DALL-E 等图像生成工具的基础。这些算法最初经过训练,可以从大量真实结构中消除计算机生成的噪声;通过学习区分现实的结构元素和噪音,他们获得了形成生物学上合理的、用户定义的结构的能力。
Baker 实验室开发的RFdiffusion 软件和马萨诸塞州萨默维尔的Generate Biomedicines 开发的 Chroma 工具利用这一策略取得了显着效果。例如,贝克的团队正在使用射频扩散来设计新型蛋白质,这些蛋白质可以与感兴趣的目标形成紧密的界面,从而产生“完全符合表面”的设计,贝克说。RFdiffusion的更新“全原子”迭代允许设计人员通过计算塑造围绕非蛋白质目标(例如 DNA、小分子甚至金属离子)的蛋白质。由此产生的多功能性为工程酶、转录调节剂、功能性生物材料等开辟了新的视野。
2023 年末,美国和英国监管机构批准了首个基于 CRISPR 的基因编辑疗法,用于治疗镰状细胞病和输血依赖性 β 地中海贫血,这是基因组编辑作为临床工具的重大胜利。
CRISPR 及其衍生物使用短的可编程 RNA 将 DNA 切割酶(例如 Cas9)引导至特定的基因组位点。它们通常在实验室中用于禁用有缺陷的基因并引入小的序列变化。精确且可编程地插入跨越数千个核苷酸的较大 DNA 序列是很困难的,但新兴的解决方案可以让科学家替换有缺陷基因的关键片段或插入功能齐全的基因序列。
加州斯坦福大学的分子遗传学家 Le Cong 和他的同事正在探索单链退火蛋白 (SSAP)——一种介导 DNA 重组的病毒衍生分子。当与 Cas9 DNA 切片功能已被禁用的 CRISPR-Cas 系统结合使用时,这些 SSAP 可以将多达 2 KB 的 DNA 精确定向插入人类基因组中。
其他方法利用基于 CRISPR 的方法(称为“引物编辑”)引入短“着陆垫”序列,选择性地招募酶,从而将大 DNA 片段精确拼接到基因组中。例如,2022 年,剑桥麻省理工学院的基因组工程师 Omar Abudayyeh 和 Jonathan Gootenberg 及其同事首次描述了通过位点特异性靶向元件 (PASTE) 进行可编程添加,这是一种可以精确插入多达 36 KB DNA 的方法 。Cong 表示,PASTE 对于培养的、源自患者的细胞的离体修饰特别有前景,并且底层的 Prime 编辑技术已经步入临床研究的轨道。但对于人体细胞的体内修饰,SSAP 可能提供更紧凑的解决方案:体积更大的 PASTE 机器需要三个独立的病毒载体进行传递,这可能会降低相对于双组件 SSAP 系统的编辑效率。也就是说,即使相对低效的基因替代策略也足以减轻许多遗传疾病的影响。
这些方法不仅与人类健康相关。北京中国科学院高彩霞领导的研究人员开发了PrimeRoot,这是一种使用prime编辑引入特定目标位点的方法,酶可以使用这些位点在水稻和玉米中插入多达20个碱基的DNA 。高认为,该技术可广泛用于赋予作物抗病和抗病原体能力,持续推动基于CRISPR 的植物基因组工程的创新浪潮。“我相信这项技术可以应用于任何植物物种,”她说。
如果您要寻找一家咖啡馆,可以使用Google 地图进行路线导航。但目前还没有类似的方法可以导航更复杂的人体景观,但在单细胞分析和“空间组学”方法的进步的推动下,各种细胞图谱计划的持续进展,对人类来说,这将对致病基因,疾病机制了解,药物发现,疾病诊断等方面产生深远影响。
这些计划中最大的是人类细胞图谱(HCA)。该联盟由英国欣克斯顿 Wellcome Sanger 研究所的细胞生物学家 Sarah Teichmann 和加利福尼亚州南旧金山生物技术公司 Genentech 现任研究和早期开发负责人 Aviv Regev 于 2016 年发起。它由来自近 100 个国家的约 3,000 名科学家组成,使用来自 10,000 名捐赠者的组织进行工作。但 HCA 也是更广泛的交叉细胞和分子图谱工作生态系统的一部分。其中包括人类生物分子图谱计划 (HuBMAP) 和通过推进创新神经技术 (BRAIN) 倡议细胞普查网络 (BICCN) 进行的脑研究 (BICCN),均由美国国立卫生研究院资助,以及艾伦脑细胞图谱 (Allen Brain Cell Atlas,由美国国立卫生研究院资助,位于华盛顿州西雅图的艾伦研究所)。
斯坦福大学基因组学家、HuBMAP 指导委员会前联合主席 Michael Snyder 表示,这些努力在一定程度上是能够推动在单细胞水平解码分子内容的分析工具的开发和快速商业化的。例如,Snyder 的团队经常使用加利福尼亚州普莱森顿 10X Genomics 的 Xenium 平台进行空间转录组学分析。该平台可以每周在 4 个组织样本中同时调查大约 400 个基因的表达。另一个例子是:马萨诸塞州马尔伯勒 Akoya Biosciences 的 PhenoCycler 平台,它们使用基于多重抗体的方法,使团队能够以单细胞分辨率以支持 3D 组织重建的格式跟踪大量蛋白质。其他“多组学”方法使科学家能够同时分析同一细胞中的多个分子类别,包括RNA 的表达、染色质的结构和蛋白质的分布。
人肺细胞图谱描述了不同的细胞类型及其调节方式。图片来源:nature
去年,数十项研究展示了使用这些技术生成器官特异性图谱的进展。例如,6 月份,HCA 发布了对人肺 49 个数据集的综合分析。Teichmann 说:“有了非常清晰的肺部地图,可以了解肺纤维化、不同肿瘤、甚至 COVID-19 等疾病发生的变化。” 2023 年,《Nature》发布了一个文章集(参阅1),重点介绍了 HuBMAP 的进展,《Science》则制作了一个文章集,详细介绍了 BICCN 的工作(参阅2)。
现在仍有大量工作要做,Teichmann 估计 HCA 至少需要五年才能完成。但最终的地图在到达时将是无价的。例如,Teichmann 预测使用图谱数据来指导组织和细胞特异性药物靶向,而 Snyder 则渴望了解细胞微环境如何告知癌症和肠易激综合症等复杂疾病的风险和病因。“我们可能不能在2024年解决这个问题,这是一个持续多年的问题,但不可否认它是整个领域的一大推动力。”斯奈德说。
帕特·贝内特的说话速度比一般人慢,有时会用错词。但考虑到运动神经元疾病(也称为肌萎缩侧索硬化症)此前曾导致她无法用语言表达自己的意思,这是一项了不起的成就。
Bennett 的康复得益于斯坦福大学神经科学家 Francis Willett 及其美国 BrainGate 联盟的同事开发的复杂脑机接口 (BCI) 设备。威利特和他的同事在贝内特的大脑中植入电极来跟踪神经元活动,然后训练深度学习算法将这些信号转化为语音。经过几周的训练,贝内特每分钟能够说出多达 62 个单词,词汇量为 125,000 个单词,是普通英语使用者词汇量的两倍多。“他们的沟通速度确实令人印象深刻,”宾夕法尼亚州匹兹堡大学开发 BCI 技术的生物工程师 Jennifer Collinger 说道。
脑机接口技术让帕特·贝内特(Pat Bennett)(坐)重新恢复了说话能力。图片来源:Steve Fisch/斯坦福大学医学院
哥廷根马克斯·普朗克多学科科学研究所的 Hell 和他的团队领导的研究人员于 2022 年末首次涉足这一领域,采用了一种名为MINSTED 的方法,使用专门的光学显微镜,该方法可以以 2.3 埃(大约1/4纳米)的精度解析单个荧光标记。
由德国哥廷根大学医学中心的神经科学家 Ali Shaib 和 Silvio Rizzoli 领导的团队开发的一步纳米级扩展 (ONE) 显微镜方法并没有完全达到这一水平的分辨率。然而,ONE 显微镜提供了前所未有的机会,可以直接对分离的和细胞中的单个蛋白质和多蛋白质复合物的精细结构细节进行成像。
RESI 的艺术家印象图,显示附着在细胞膜蛋白质上的 DNA 链和突出显示两个相邻碱基的 DNA
一种称为 RESI 的成像形式可以对 DNA 中的单个碱基对进行成像。图片来源:马克斯·伊格莱西亚斯,马克斯·普朗克生物化学研究所
使用 3D 打印技术由铜制成的微型晶格结构
研究人员利用水凝胶制作了微型金属结构。图片来源:Max Saccone/Greer 实验室
发表评论 取消回复