PDB数据库是一个数据中心,主要包含:原子坐标,蛋白质结构的其他信息和除蛋白以外生物大分子的信息。
结构生物学家使用诸如X射线晶体学,NMR光谱和冷冻电镜等方法来确定每个原子在分子中相对于彼此的位置。他们会提交此结构信息,然后由wwPDB对其进行批注并公开发布到数据库中。
不断增长的PDB反映了全世界实验室正在积极的开展结构生物学的研究。庞大的数据让科学家在使用PDB数据库的时候既有趣又充满了挑战。生命的中心过程中涉及的许多蛋白质和核酸都有可用的结构,因此您可以去PDB档案库查找核糖体,致癌基因,药物靶标甚至整个病毒的结构。但是,由于PDB存档了许多不同的结构,因此找到所需信息可能是一个挑战。您通常会发现给定分子的多个结构,部分结构或已从其天然形式被修饰或失活的结构。
本文旨在帮助您了解结构文件和相关信息,并帮助您避免一些常见的陷阱。接下来会有很多专题分别描述PDB数据的要点, 把这些知识点彼此交织在一起,会对结构生物学数据有一个更好的理解。
PDB数据格式:
存储在PDB档案中的主要信息包括生物分子的坐标文件。这些文件列出了每种蛋白质中的原子,以及它们在空间中的3D位置。这些文件有几种格式(PDB,mmCIF,XML)。典型的PDB格式化文件包括一个较大的文本“页眉”部分,该部分概述了蛋白质,引证信息以及结构解决方案的详细信息,随后是原子的序列和长列表及其坐标。档案中还包含用于确定这些原子坐标的实验观测值。
•可视化结构信息:
尽管您可以使用文本编辑器直接查看PDB文件,但是通常使用浏览或可视化程序查看它们是最有用的。在线工具(例如RCSB PDB网站上的工具)使您可以搜索和浏览PDB标头下的信息,包括有关实验方法以及蛋白质的化学和生物学信息。找到感兴趣的PDB条目后,您可以使用可视化程序允许您读取PDB文件,在计算机上显示蛋白质结构并为其创建自定义图片。这些程序通常还包括分析工具,使您可以测量距离和键合角度,并识别有趣的结构特征。
最常见的工具有:
• 结构模型查看,分析及作图软件:PyMol, Discovery Studio, Chimera等(网上都有免费版本下载);
• PyMol:https://sourceforge.net/projects/pymol/
• DS: https://www.3dsbiovia.com/products/collaborative-science/biovia-discovery-studio/visualization-download.php
• Chimera:https://www.cgl.ucsf.edu/chimera/download.html
• 分析蛋白是否形成多聚体及相互作用界面分析:PISA,网址:http://www.ebi.ac.uk/pdbe/pisa/
• 蛋白与配体(底物)结合位点预测:https://zhanglab.ccmb.med.umich.edu/COACH/ 分子对接(柔性):
• AutoDock,http://mgltools.scripps.edu/downloads AutoDock实例教程:http://www.novopro.cn/articles/201712271167.html
• 查看电子云密度图,结构验证:Coot, https://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/
•读取坐标文件
当您开始探索PDB档案中的结构时,您将需要了解有关坐标文件的一些知识。在一个典型的条目中,您将找到生物分子,小分子,离子和水的多种混合物。通常,您可以使用名称和链ID来进行分类。在由晶体学确定的结构中,原子用温度因子标注,该温度因子描述了它们的振动和占有率,这些占有率表明了它们是否以几种构象出现。 NMR结构通常包括几种不同的分子模型。
•潜在难点
浏览PDB存档时,您可能会遇到一些挑战。例如,许多结构,尤其是通过晶体学确定的结构,仅包括有关功能性生物装配体一部分的信息。幸运的是,PDB可以提供帮助。同样,许多PDB条目是分子中缺少的部分,在实验中未观察到。这些包括仅包含α碳原子位置的结构,具有缺失环的结构,单个域的结构或较大分子的亚基。另外,大多数晶体结构条目没有关于氢原子的信息。
来源:https://pdb101.rcsb.org/learn/guide-to-understanding-pdb-data/introduction
Souce: 纽普生物 2019-12-02