生信蛋白分析数据库与ID转换

发布于:2023-01-02 ⋅ 阅读:(1028) ⋅ 点赞:(0)

对于数据分析(工程师)来说,数据库的海量信息可能蕴含着无数的新发现!

目录

前言

一、PDB

1.如有PDBID

二、chembl

1.基本信息

2.转化chemblID为uniprotID

3.使用chembl API 代码检索

 三、bindingd


前言

生物信息学是生命科学与计算机科学等学科的交叉学科;蛋白在生物体中扮演着极为重要的功能,分析蛋白结构、功能也有助于药物的开发。以下常用数据库提供了许多极为重要的参数。


一、PDB

对于分析二三级结构,PDB数据库(RCSB PDB: Homepage)极为有用,且有众多蛋白结构(194,820 个)。

分为两种情况,已知蛋白序列和已知PDBID(以已知PDBID为例)。

1.如有PDBID

 

 用于蛋白对接分析时一般不考虑离子配体。

二、chembl

 chembl生物化学信息数据库,展示了生物活性、目标蛋白(target等信息)

1.基本信息

2.转化chemblID为uniprotID

uniprotmapping(UniProt)可以实现这一转换。

 结果如下:

3.使用chembl API 代码检索

chembl API 是用Python写成的化学信息学分析代码,原理是SQL命令提取数据库信息,你可以在Python管理工具中安装这个库并使用,

GitHub - chembl/chembl_webresource_client: Official Python client for accessing ChEMBL APIOfficial Python client for accessing ChEMBL API. Contribute to chembl/chembl_webresource_client development by creating an account on GitHub.https://github.com/chembl/chembl_webresource_client在线jupyter文档,无需安装,只要修改target_name等信息就可快速使用。

Binderhttps://mybinder.org/v2/gh/chembl/chembl_webresource_client/master?filepath=demo_wrc.ipynb

根据chembl里的专利号可以进一步去surechembl查看同一专利下的化学分子 

 

 三、bindingdb

BindingDBhttps://www.bindingdb.org/可以根据PDB ID寻找小分子亲和力信息:Kd越低亲和力越好,一定情况下,ki=kd


本文含有隐藏内容,请 开通VIP 后查看