生命代码的数字化探索:CFPS系统与计算机模型的深度融合

2024-04-01

一.引言

 

无细胞蛋白质合成(Cell-Free Protein Synthesis, CFPS)系统以其独有的“开放式”架构,正在成为揭示细胞内转录与翻译机制的强大工具。近年来,CFPS模型已经成为生物工程和生物技术领域的重要工具,它不仅可以模拟转录和翻译过程,还可以充当生物技术领域快速原型开发的平台,尤其适用于计算机辅助设计和体外生产系统的初步测试。

 

珀罗汀生物小编今天和大家分享这篇名为“Modeling Cell-Free Protein Synthesis Systems—Approaches and Applications”的文献。

 

图片

 

二.介绍

 

CFPS建模研究旨在通过实验数据的参数回归来识别关键模型参数。然而,模型的复杂性有所不同。根据趋势,模型可以分为四组不同的粒度。本文详细介绍了不同类型模型的发展和应用情况,包括最小模型、结构化模型、非结构化模型和混合模型。这些模型具有不同程度的复杂性,从简单描述蛋白质组分到更全面描述反应网络。此外,还介绍了一些最新进展,如将基因电路与代谢网络耦合以及利用数据集成来改善机械分辨率等方面。最后,文中讨论了未来可能面临的挑战和机遇,包括如何利用代谢组学和蛋白质组学等数据来改进CFPS模型构建方法等。

 

CFPS系统模型构建的多样性和针对性,取决于所关注的系统环境、建模方法(确定性或随机性)以及模型细节程度(粒度)。没有绝对的“好”或“坏”,只有针对特定目的最优的模型。

 

图片

 

图1:CFPS模型的分类

 

三.CFPS模型的开发和应用

 

在连续模型中,利用常微分方程(ODE)和代数方程来动态描述模型状态。在结构化模型中,方程包含亲和常数和其他参数。混合模型则是结合两者特点,专注于特定反应网络。一般来说,CFPS机械模型的质量在很大程度上依赖于结构和参数识别的准确性。在大多数经典的CFPS建模方法中随机效应只起着次要作用。而在小规模反应中,最好使用离散和随机模型进行描述。

 

四.识别CFPS系统中的瓶颈

 

描述GFP体外表达最直接的方法是在黑匣子模型中大分子成分、DNA、mRNA和蛋白质,并将动力学方程拟合到GFP产生、mRNA产生和mRNA降解的实验结果中,这种方法也称为“最小模型”。

Karzbrun等人提出了一个由四个酶反应组成的粗粒度动力学模型。对大肠杆菌细胞粗提物进行动力学研究,以确定生物合成和降解参数。Stögbauer等人选择了类似的粒度。模拟和分析PURExpress系统收集的结果,虽然忽略了蛋白质降解,但涵盖了更广泛的实验范围,确定了翻译系统失效时的平台期。Chizzolini等人拓展了最小模型,解决了当前CFPS模型的局限性,即仅对狭窄的实验数据集具有特异性,预测能力有限,并忽略了生物物理因素(如RNA二级结构)。对于具有类似复杂性的模型系统,可通过将最小模型扩展到具有mRNA状态附加项的结构化描述,从而提高实验数据的预测质量。

更精细的模型被用来识别计算机研究中的底物限制。Arnold等人引入了混合模型,一个简化的转录模型与详细描述的翻译过程相连,使用核糖体流动模型来模拟核糖体沿着一维离散模板的运动。这种方法可以仔细研究不同成分对翻译率的影响。延伸因子Tu和tRNA浓度被确定为阻碍翻译速率的最敏感参数。作为体外和体内条件之间的一个关键区别,确定了从三元复合物到翻译起始的控制转变。开发了一个同样复杂的系统来评估伪稳态的稳定性,揭示代谢物簇的时间稳定性、它们的坍塌和重新合并,直到达到最终稳态。

 

五.脂质体胶囊蛋白合成的分析和预测

 

体外蛋白质合成的一种特殊情况是将CFPS组件封装于脂质体中的方法。初步研究发现,GFP生产动力学与脂质体大小和脂质组成密切相关。该方法允许通过观察不同的脂质体直径或通过考虑脂质体内不同量的CFPS组分,在不同的起始条件下筛选GFP的产生。与连续CFPS模拟一致,确定了最大化GFP形成的最佳DNA水平。系统与DNA的过饱和降低了GFP的产量。这一发现反映了转录过程中巨大的能量需求。后续研究表明,一些结果可以用一个不那么复杂的模型来实现。

 

六.扩大CFPS建模的范围

 

CFPS系统已成为基因回路的理想试验平台,相比传统细胞内工程,其原型设计更为便捷快速。因此,已开发出描述这些系统的数学模型。这些模型涵盖了多种调控回路,如双基因级联、sigma因子引导的调控、复杂的遗传环振荡器以及经实验验证的RNA回路控制器。构建的“最小模型”通常由3至10个常微分方程和质量平衡组成,将mRNA、调控RNA或蛋白质产物作为模型物种,并采用质量作用、Hill或Michaelis-Menten动力学描述调控过程。即使采用粗粒度模型,也能成功模拟并预测高度动态系统。模型引导的回路设计显著缩短了开发周期。

这些计算机模型的使用不限于定义明确的模型系统,Moore等人研究了巨大芽孢杆菌的CFPS能力,将机器人液体处理与TX-TL系统的粗粒度ODE模型(26个参数、14个物种和18个反应)联系起来。Gyorgy和Murray用遗传回路的最小模型制定了研究CFPS中资源竞争的模型方法。此外,Varner及其同事提出了一种基于约束的模型来模拟大肠杆菌CFPS提取物的能量和底物供应,将蛋白质生产的简化描述和变构酶调节与代谢网络联系起来。

 

图片

 

表1:CFPS模型的不同粒度概述。

 

七.总结

 

CFPS模型可以识别转录和翻译过程中的瓶颈,并从模型数据中推断动力学参数。大多数模型预测的共识是将翻译过程而非转录过程确定为CFPS系统进一步发展的关键靶点之一。随着CFPS系统和遗传回路变得更加复杂,考虑资源共同负担的模型将成为焦点。

 

随着生物医学领域的发展,在模型研究和实验设置之间必须建立一个反馈回路来加速研究进程。此前对遗传电路模型的研究已经证明,使用CFPS可以快速、简单地进行原型设计。CFPS系统的计算机研究有助于我们理解相互作用,并确定这些系统中的局限性和瓶颈,从而可以优化生产工艺,促进科技发展。

 

参考文献:Müller J, Siemann-Herzberg M, Takors R. Modeling Cell-Free Protein Synthesis Systems-Approaches and Applications. Front Bioeng Biotechnol. 2020;8:584178. Published 2020 Oct 28. doi:10.3389/fbioe.2020.584178.