同源建模

同源建模(CLC Drug Discovery Workbench版)

一,为什么需要同源建模

药物与蛋白靶点识别、蛋白-蛋白相互作用等是发生于3D结构水平,因此,获得蛋白3D结构是非常重要的。同时,靶点蛋白质三级结构是进行基于结构药物设计的基础:比如分子对接、基于结构的药效团识别等;蛋白质的3D结构也是分子动力学模拟等很多计算的起点。遗憾的是,并非所有您感兴趣的靶点都有合适的3D结构可以利用。这时,蛋白质3D结构的预测就可以帮上忙:同源建模是其中成功率最高、最重要的一种方法。

二,CLC Drug Discovery Workbench自带同源建模工具

CLC Drug Discovery Workbench (CLC DD)是CLC Bio公司合并Molegro公司后,将分子对接软件Molegro与其自身强大的生物信息学结合后开发的新产品:整合生物信息学(序列比对、蛋白结构分析、同源建模)与分子对接技术于一体。本教材从一个序列出发,演示如何用CLC DD进行同源建模。

三,同源建模流程

同源建模分两步:1)同源识别:通过序列比对来实现;2)3D结构预测。

前期准备:待预测3D结构的序列,保存为fasta格式(点此下载:query.fasta)。

第一步:同源识别

1,导入序列

File>>Import>>Standard Import
出现导入对话框,确认Format为fasta,从文件夹里选中query.fasta
点击next按钮,选择一个Navigation Area的文件夹,比如demo以保存文件,点Finish按钮。

现在,Navigation Area的demo目录下多了个蛋白序列文件,P1:Query

双击P1:Query,可以展示出序列信息

2,序列比对

在Navigation Area右键点击P1:QUERY,弹出右键菜单,点击:
Toolbox>>Sequence Analysis>>Find and Model Structure…

弹出Find and Model Structure对话框。

确认Selected element栏里有P1:QUERY。

点击Next按钮,会问结果处理方式,这里用默认值,再点击Next按钮,然后点Finish按钮。

稍等便刻,序列比对结束,在Navigation Area里会生成一个新的文件Structures found for P1:QUERY。

3,序列比对结果分析与同源识别

在Navigation Area里双击Structures found for P1:QUERY,展示结果。

本例里命中了1812个3D结构,已经按E-Value、百分一致性匹配、百分覆盖度等排序。

一般来说,E-Value越低,百分一致性匹配越高的蛋白与我们提交的序列同源的概率越大。

同源建模:3D模型预测

选择其中一个3D结构,即点击Available Structures例的一个4字母PDB结构,弹出菜单,点击Download and Create Model,建模自动开始。在ToolBox的Processes栏会展示建模进度。

建模结束后,会自动弹出预测的3D模型,以及对应的比对结果。您可以分析生成的3D模型,保存生成的模型。

四,后续工作

您可以进行进一步用CLC Drug Discovery Workbench进行分子对接,或Ligandscout进行药效团识别、虚拟筛选等。

五,联系我们

[contact-form-7 id=”832″ title=”contact”]