Generated with sparks and insights from 3 sources

img10

img11

img12

img13

img14

img15

Introduction

  • DLKcat工具箱是一个Matlab/Python软件包,用于预测酶的kcat值并生成酶约束的基因组规模代谢模型(ecGEMs)。

  • DLKcat模型主要分为两个部分:DeeplearningApproach和BayesianApproach。

  • DeeplearningApproach使用深度学习方法预测kcat值,输入为蛋白质序列和底物的SMILES结构或名称。

  • BayesianApproach提供了一个基于贝叶斯方法的自动管道,用于使用预测的kcat值构建ecModels。

  • DLKcat模型能够捕捉突变酶的kcat变化,并识别对kcat值有强烈影响的氨基酸残基。

  • 该模型已被应用于预测300多种酵母物种的基因组规模kcat值。

  • DLKcat模型的研究成果于2022年6月16日发布在《Nature Catalysis》上。

工具箱功能 [1]

  • 预测kcat值:DLKcat工具箱可以高通量预测代谢酶的kcat值。

  • 生成ecGEMs:工具箱能够生成酶约束的基因组规模代谢模型。

  • 深度学习方法:DeeplearningApproach使用深度学习技术进行kcat预测。

  • 贝叶斯方法:BayesianApproach提供了基于贝叶斯方法的自动化管道。

  • 捕捉突变:DLKcat能够捕捉突变酶的kcat变化。

  • 识别关键残基:模型可以识别对kcat值有显著影响的氨基酸残基。

使用方法 [2]

  • 安装:建议使用Anaconda创建两个虚拟Python环境(3.7和2.7版本)。

  • 数据预处理:在数据预处理阶段,文件所需的环境不同,需要灵活变换。

  • 预测输入:输入为蛋白质序列和底物的SMILES结构或名称。

  • 预测输出:输出为相应的kcat值。

  • 示例文件:用户可以参考DeeplearningApproach/Code/example/input.tsv文件进行预测。

  • 常见问题:在数据预处理过程中,可能需要挂VPN并控制访问时间间隔。

研究背景 [3]

  • 酶周转数(kcat):kcat是了解细胞代谢、蛋白质组分配和生理多样性的关键参数。

  • 数据稀疏:实验测量的kcat数据往往稀疏且嘈杂。

  • 高通量预测:DLKcat提供了一种高通量预测kcat的方法。

  • 研究团队:查尔姆斯理工大学的研究团队开发了DLKcat模型。

  • 发表日期:研究成果于2022年6月16日发布在《Nature Catalysis》上。

  • 应用范围:DLKcat模型已被应用于预测300多种酵母物种的基因组规模kcat值。

应用实例 [3]

  • 酵母物种:DLKcat模型已被应用于预测300多种酵母物种的基因组规模kcat值。

  • 突变酶:DLKcat能够捕捉突变酶的kcat变化。

  • 氨基酸残基:模型可以识别对kcat值有强烈影响的氨基酸残基。

  • 表型预测:生成的ecGEMs在预测表型和蛋白质组方面优于先前的模型。

  • 蛋白质工程:DLKcat可以作为蛋白质工程工具箱的重要组成部分。

  • 基因组挖掘:DLKcat的kcat预测工具可用于基因组挖掘和全基因组关联研究分析。

常见问题 [2]

  • 环境配置:建议使用Anaconda创建两个虚拟Python环境(3.7和2.7版本)。

  • 数据获取:在数据预处理过程中,可能需要挂VPN并控制访问时间间隔。

  • 包报错:所有加载的包一定要与Python版本对应,避免报错。

  • 数据清理:SABIO-RK的数据清理文件可以运行,但后续可能未用到。

  • 批次下载:由于下载文件过大,运行过程中容易被网站拒绝,建议进行批次下载。

  • 示例文件:用户可以参考DeeplearningApproach/Code/example/input.tsv文件进行预测。

<br><br>