蛋白质结构
蛋白质结构是指蛋白质分子的空间结构。作为一类重要的生物大分子,蛋白质主要由碳、氢、氧、氮、硫等化学元素组成。所有蛋白质都是由20种不同的L型α氨基酸连接形成的多聚体,在形成蛋白质后,这些氨基酸又被称为残基。蛋白质和多肽之间的界限并不是很清晰,有人基于发挥功能性作用的结构域所需的残基数认为,若残基数少于40,就称之为多肽或肽。要发挥生物学功能,蛋白质需要正确折叠为一个特定构型,主要是通过大量的非共价相互作用(如氢键,离子键,范德华力和疏水作用)来实现;
基本信息
- 中文名字
蛋白质结构
- 蛋白质结构
从一级结构到四级结构1
- 含义
蛋白质分子的空间结构
- 结构分类
SCOP、CATH、FSSP
- 性质
一类重要的生物大分子
- 外文名
protein structure
- 组成元素
碳、氢、氧、氮、硫等化学元素
基本简介
作用
1.构成生物体内基本物质,为生长及维持生命所必需;
2.部分蛋白质可作为生物催化剂,即酶和激素;
3.生物的免疫作用所必需的物资;
4.有些蛋白质会导致食物过敏。
应用
在结构基因组学中的应用
已经测定了酿酒酵母(Saccharomyces cereuisiae)、线虫(Caenorhabditis elegans)、果蝇(Drosophilamelanogaster)、拟南芥(Arabidopsis thaliana)等模式生物的基因组序列.。特别值得一提的是,随着人类基因310福建农林大学学报(自然科学版) 第35卷组计划(Human Genome Program)的完成,接下来的重点就转移到研究这些基因组里的所有基因的结构和功能。因此,结构基因组学受到了世界各国的高度重视,美国、日本、欧洲纷纷建立了结构基因组学的研究机构。结构基因组学就是以大规模、高通量测定这些基因的表达产物蛋白质分子的结构为研究目标,以高通量基因克隆技术、蛋白质表达及其纯化、蛋白质结晶、蛋白质结构测定为主要研究内容的基因组学分支。
蛋白质结构测定比基因组测定难度大得多,按照常规的实验步骤,从基因序列到相应的蛋白质结构测定之间还要经过基因表达、蛋白质的提取和纯化、结晶、X射线衍射分析等步骤。由于蛋白质结构和性质的多样性,这些步骤大多没有固定的规律可循,因而,这种作坊式的需要高超技巧和丰富经验的研究方法难以适应测定生物蛋白质组中所有蛋白质的要求,因此,需要建立理论分析方法来解决这些问题。以预测技术水平,预测结果的精确度不如X射线衍射分析和NMR等实验手段,但蛋白质结构预测是大规模、低成本和快速获得三维结构的有效途径,例如当目标蛋白质和模板蛋白质的序列相似性超过 30% 时,以结构预测方法建立的蛋白质三维结构模型就可以用于一般性的功能分析。因而,蛋白质预测技术在结构基因组学中得到了广泛的应用。
在药物设计中的应用
从基因组数据到新药物的过程分为2个部分:一是选择目标蛋白,二是选择合适的药物,药物分子必需与目标蛋白质分子紧密结合、容易合成且没有毒副作用。传统的药物设计通过筛选大量的天然化合物、已知的底物或配基的类似物(anaIogs)以及生物化学研究来确定前导物(Iead compounds),较少依赖目标蛋白质的三维结构,因而研发周期长、费用巨大,并且带有或多或少的盲目性。随着蛋白质结构数据的增长和结构预测技术的发展,目标蛋白质分子三维结构的信息对于上述 2 个过程发挥着越来越大的作用,计算机辅助的药物设计(computer-aided drug design)可以缩短研发周期和降低成本。
在蛋白质设计中的应用
蛋白质设计的目标是通过计算机辅助的算法以生成符合目标蛋白质三维结构的氨基酸序列,经过漫长的进化,自然界已经筛选出了数量众多的蛋白质,但天然蛋白质只有在自然条件下才发挥最佳功能,这使得人们利用这些蛋白质受到了限制,因此需要对蛋白质进行改造使其能适应特定条件发挥特定的功能。蛋白质分子的设计分为3类:小改、中改和大改。 2
类型
许多蛋白质都可以被分为多个结构组成单元,结构域就是这样一个组成单元。结构域一般可以自稳定,且常常独立进行折叠,而不需要蛋白质其他部分的参与;很多结构域都有自己独特的生物学功能。很多结构域并不是一个基因或基因家族对应蛋白质的独特结构单元,而往往是许多类蛋白质的共同结构单元。结构域常常是以其生物学功能来命名,如“钙离子结合结构域”;或以几类最初发现此结构域的蛋白名称衍生而来,如PDZ结构域(最初发现于PSD95、DlgA和ZO-1这三个蛋白质)。由于结构域自身可以稳定存在,因此可以将不同来源的结构域通过遗传工程人为地结合在一起,形成杂合蛋白质。
结构花样(structural motif)同样是一种结构组成单元,它是由几个二级结构的特定组合(如螺旋-转角-螺旋)所组成;这些组合又被称为超二级结构。结构花样往往还包含有长度不同的loop区。
折叠类型则指的是整体的结构排列类型,如螺旋束和β桶。
尽管真核生物体可以表达数万种不同的蛋白质,但对应的结构域、结构花样与折叠类型的数量却少得多。一种合理的解释是,这是进化的结果;因为基因或基因的一部分可以在基因组内被加倍或移动。也就是说,通过基因重组,一个结构域可以从相应蛋白质A移动到本不具有此结构域的蛋白质B上,而其发生的进化驱动力可能是由于该结构域对应的生物学功能趋向于被蛋白质B所利用。