合成生物学的赋能新工具——无细胞表达系统

2023-03-22

 

翻开人类的历史书卷,就能看到一场认识自然、利用自然到改造自然的历程。从远古时代的茹毛饮血,到农耕时代的刀耕火种,再到如今转基因、无土栽培引领时代的浪潮,人类总是在接触自然、学习自然中一步一步地走向未来。

 

细胞,是生物体进行生命活动的基础单元。1665年,胡克利用自制的显微镜,第一次观察到了软木塞切片中的小室,“cell”这个单词应运而生,开启了人类对细胞的认识之旅。细胞犹如生命体的生产工厂,源源不断地产生着活性分子以维持生命活动。现如今,人类已经不满足于仅仅是单纯地认识分子与细胞的结构与功能,我们有了更大的目标与憧憬——利用细胞、改造细胞。

 

 

 

合成生物学是在解构生物活性分子和细胞的结构和功能以后,以人类掌握的各种工具进一步模拟并利用生命活动的各个阶段,以达到改善人类生活的目的。

 

合成生物学在方法学上可以分成自上而下和自下而上两种方式。

 

  • 自上而下指的是使用代谢和基因工程技术赋予细胞新的功能以达目的。
  • 自下而上指的是指创建新生物系统在体外通过汇集“非活”的生物分子组分以构建新的人造细胞。在基因编辑技术极为成熟的今天,通过改变细胞的遗传编码而达到细胞能为己所用的目的是一种极为便捷的技术。而这极大的推动了合成生物学的发展。
 
 

合成生物学的应用

 

合成生物学在农业、化工、食品、能源、医疗、材料等领域都有重要的应用。

 

例如在医疗药物领域,合成生物学在疫苗开发、分子诊断、基于细胞的治疗和新型药物的研发中都有着重要的应用。低成本核酸合成的出现使合成生物学家能够利用大规模同义突变重新设计整个病毒基因组。合成生物学家有目的地使用代表性不足的密码子来减少人类细胞中病毒蛋白的产生,从而快速可靠地在无需详细了解病毒功能的前提下产生减毒病毒蛋白。该技术在脊髓灰质炎病毒、流感病毒、呼吸道合胞病毒和登革热病毒等减毒疫苗上都有应用。

 

 

无细胞蛋白合成技术

 

无细胞蛋白质合成(Cell-free Protein Synthesis, CFPS)系统是以外源DNA或mRNA为模板,人工添加所需原料和能源物质,以细胞提取物为条件合成蛋白的体外基因表达系统,可以突破细胞限制,方便快捷的表达各种蛋白质。CFPS的第一步是将生物体细胞裂解,将其细胞器提取出来,再混合合成反应需要的能量、原材料等物质形成反应液。在向该反应液中加入外源性DNA或者mRNA作为模板后,体系内将进行蛋白表达反应。CFPS相较于传统蛋白表达方法有着产物和能量转化效率更高、可表达蛋白更丰富、反应时间短、调控方便和合成效率高等优点。

 

 

 
 

CFPS在合成生物学中的运用

 

在合成生物学中,CFPS在代谢工程、生物传感器、基因电路、人工细胞和AI辅助的高通量蛋白药物筛选等领域都有着应用前景。

 
 

CFPS在代谢工程中的运用

 

随着代谢工程和合成生物学的发展,无细胞代谢工程(cell-free metabolic engineering, CFME)已被用于生产生物材料、生物燃料和药物前体。最初,CFME是通过使用纯化的酶组装代谢途径来进行的。然而,体内蛋白质表达和每种途径蛋白质的纯化都是费力和耗时的。而将无细胞蛋白表达引入,可以达到加快代谢工程的DBT(design-build-test)循环的效果。

 

Wu与其研究团队利用CFPS进行1,4-丁二醇(BDO)生物合成的快速方案设计[1]。其通过CFPS手段表达各种代谢酶,不仅验证了代谢通路和各种途径酶的功能,还确定了BDO途径的限速步骤(4-羟基丁酸转化为下游代谢产物)。该团队通过调节各种酶表达水平和增加下游酶表达水平的方式,显著地提高了BDO的产量。这证明CFPS可以作为代谢工程和合成生物学应用的支持平台。对BDO代谢通路的探索,证明了CFPS可以快速调节途径酶的表达水平,并筛选具有改进催化活性的酶变体以提高产物产量。该结果证明了CFPS-ME可以直接应用于体内菌株的开发。

 

CFPS在生物传感器和基因电路的运用

 

合成生物学设计的无细胞生物传感器是检测各项临床相关生物标志物的一种很有前途的新工具。

 

Wen和其团队设计了一种基于大肠杆菌的无细胞系统的生物传感器,在其中实现了利用铜绿假单胞菌的酰基同型丝氨酸内酯的传感电路来分析囊性纤维化患者的痰液样本的效果。[2]其研究结果表明,通过优化无细胞系统和样品提取方式,可以在纳摩尔水平上对囊性纤维化肺痰液样品中的分子3-oxo-C12-HSL进行定量测量。这项研究进一步说明了模块化无细胞生物传感器作为快速、低成本检测方法的潜力,也表明它有潜力成为检测和监测人类呼吸道样本中病原体生物标志物的平台。

 

 

AI辅助的高通量蛋白药物筛选

 

22年年末23年年初,ChatGPT破圈了!

 

AI正在科技界引领一场新的革命。在传统的研发过程中,学者从学科基础知识出发,通过假设和实验的互相验证和证伪,提出新的学科知识并被被后来人记录学习。这一过程推动着学科知识地前进。而AI的出现将极大化的加速这一过程。在人工搭建好新生AI之后,研究者会给AI输入实验条件并告知其对应的实验结果,通过大规模的数据训练,让AI试图找出实验条件与结果之间的联系。通过这种联系,让AI自主设计实验条件,并预测想要的实验结果。实验人员执行AI设计的实验条件,并将实验结果反馈给AI,使得AI对自身判定程序进行修正优化,以达到AI指导实验的效果。

 

在20年初,谷歌宣布其开发的AlphaFold实现了AI预测蛋白质结构折叠,并在和科学家的蛋白预测竞赛中大放异彩。极大得加速了对蛋白质结构和功能研究的进一步探索。这一结果揭示了AI在科研领域中的极大研究潜力。

 

在今年1月,来自Salesforce Research、Tierra Biosciences 和加州大学的研究团队在实验室中合成了由AI模型预测的蛋白质,并发现它们与天然对应物一样有效。[3]该研究以「Large language models generate functional protein sequences across diverse families」为题,于2023年1月26日发布在《Nature Biotechnology》上。

 

其研究团队受到基于深度学习的自然语言模型的成功启发,开发了ProGen,这是一种蛋白质的语言模型。通过让AIProGen深度学习来自公开的已测序天然蛋白质数据库中的2.8亿个原始蛋白质序列的训练,掌握了可以自主设计蛋白序列以完成目的功能效果的能力。

 

 

该研究团队让ProGen自主进行溶菌酶的序列设计,根据其设计的序列进行质粒的编码,运用无细胞蛋白合成技术在体外高通量合成上百个蛋白。研究人员对其活性进行测试,并将它们的活性与鸡蛋清中发现的一种酶(Hen Egg White Lysozyme,HEWL)进行比较在活性验证。研究人员发现了其中两种人工酶能够以与HEWL相当的活性分解细菌的细胞壁,但它们的序列彼此只有约18%相同。这两个序列与任何已知蛋白质的同一性约为90%和70%。

 

该研究是一个对AI辅助的高通量蛋白药物筛选实践的极好启示。而在AI的光辉之下,无细胞蛋白合成技术的重要性也不可忽略。

 

在AI辅助的高通量蛋白药物筛选中,高通量是有个重要因素。AI训练需要大量数据,这也意味着需要大量的从序列合成蛋白的实验结果。传统的将质粒转染至大肠杆菌后鉴别扩增的方法,其一种蛋白表达周期一般为4-7天,这是对时间和人力成本的极大消耗。而选择无细胞蛋白合成技术来进行蛋白的表达,其可以在96孔板中进行反应,且反应时间为2-8h。极大的缩减时间和人力成本的消耗。在1个96孔板中,其可以同时进行96个反应,即同时表达出96种蛋白,这对实验通量提高的帮助是显而易见的。故而使用无细胞蛋白合成技术来进行AI辅助的大分子蛋白药物的筛选是明智的选择。