Generated with sparks and insights from 3 sources
Introduction
-
DLKcat工具箱是一个Matlab/Python软件包,用于预测酶的kcat值并生成酶约束的基因组规模代谢模型(ecGEMs)。
-
DLKcat模型主要分为两个部分:DeeplearningApproach和BayesianApproach。
-
DeeplearningApproach使用深度学习方法预测kcat值,输入为蛋白质序列和底物的SMILES结构或名称。
-
BayesianApproach提供了一个基于贝叶斯方法的自动管道,用于使用预测的kcat值构建ecModels。
-
DLKcat模型能够捕捉突变酶的kcat变化,并识别对kcat值有强烈影响的氨基酸残基。
-
该模型已被应用于预测300多种酵母物种的基因组规模kcat值。
-
DLKcat模型的研究成果于2022年6月16日发布在《Nature Catalysis》上。
工具箱功能 [1]
-
预测kcat值:DLKcat工具箱可以高通量预测代谢酶的kcat值。
-
生成ecGEMs:工具箱能够生成酶约束的基因组规模代谢模型。
-
深度学习方法:DeeplearningApproach使用深度学习技术进行kcat预测。
-
贝叶斯方法:BayesianApproach提供了基于贝叶斯方法的自动化管道。
-
捕捉突变:DLKcat能够捕捉突变酶的kcat变化。
-
识别关键残基:模型可以识别对kcat值有显著影响的氨基酸残基。
使用方法 [2]
-
安装:建议使用Anaconda创建两个虚拟Python环境(3.7和2.7版本)。
-
数据预处理:在数据预处理阶段,文件所需的环境不同,需要灵活变换。
-
预测输入:输入为蛋白质序列和底物的SMILES结构或名称。
-
预测输出:输出为相应的kcat值。
-
示例文件:用户可以参考DeeplearningApproach/Code/example/input.tsv文件进行预测。
-
常见问题:在数据预处理过程中,可能需要挂VPN并控制访问时间间隔。
研究背景 [3]
-
酶周转数(kcat):kcat是了解细胞代谢、蛋白质组分配和生理多样性的关键参数。
-
数据稀疏:实验测量的kcat数据往往稀疏且嘈杂。
-
高通量预测:DLKcat提供了一种高通量预测kcat的方法。
-
研究团队:查尔姆斯理工大学的研究团队开发了DLKcat模型。
-
发表日期:研究成果于2022年6月16日发布在《Nature Catalysis》上。
-
应用范围:DLKcat模型已被应用于预测300多种酵母物种的基因组规模kcat值。
应用实例 [3]
-
酵母物种:DLKcat模型已被应用于预测300多种酵母物种的基因组规模kcat值。
-
突变酶:DLKcat能够捕捉突变酶的kcat变化。
-
氨基酸残基:模型可以识别对kcat值有强烈影响的氨基酸残基。
-
表型预测:生成的ecGEMs在预测表型和蛋白质组方面优于先前的模型。
-
蛋白质工程:DLKcat可以作为蛋白质工程工具箱的重要组成部分。
-
基因组挖掘:DLKcat的kcat预测工具可用于基因组挖掘和全基因组关联研究分析。
常见问题 [2]
-
环境配置:建议使用Anaconda创建两个虚拟Python环境(3.7和2.7版本)。
-
数据获取:在数据预处理过程中,可能需要挂VPN并控制访问时间间隔。
-
包报错:所有加载的包一定要与Python版本对应,避免报错。
-
数据清理:SABIO-RK的数据清理文件可以运行,但后续可能未用到。
-
批次下载:由于下载文件过大,运行过程中容易被网站拒绝,建议进行批次下载。
-
示例文件:用户可以参考DeeplearningApproach/Code/example/input.tsv文件进行预测。
<br><br>