• 1.摘要
  • 2.基本内容

DIP

5
蛋白相互作用数据库

基本内容

DIP:蛋白相互作用数据库(DatabaseofInteractingProtein,DIP)研究生物反应机制的重要工具。DIP可以用基因的名字等关键词查询,使用上较方便。查询的结果列出节点(node)与连结(link)两项,节点是叙述所查询的蛋白质的特性,包括蛋白质的功能域(domain)、指纹(fingerprint)等,若有酶的代码或出现在细胞中的位置,也会一并批注。连结所指的是可能产生的相互作用,DIP对每一个相互作用都会说明证据(实验的方法)与提供文献,此外,也记录除巨量分析外,支持此相互作用的实验数量。DIP还可以用序列相似性(使用Blast)、模式(pattern)等查询。至2002年6月,已收录了约一万八千个蛋白质间的相互作用信息条目。

BIND所收录的资料较少,不过其呈现的信息方式比DIP要实用,除了记录相互作用条目外,还特别区分出其中的一些复合物及其反应路径。因为复合物与反应路径中含有多种相互作用,所以至2002年11月就收录有的相互作用总数约一万一千多条。在BIND中所纪录的内容与DIP相似,包括蛋白质的功能域、在细胞中表达的位置等。对于蛋白质间的相互作用,以文字叙述的方式呈现证据,并提供文献的链接。BIND这种区分出复合物与路径的作法,让使用者能节省许多解读数据的精力,这是比DIP强的地方;在查询接口上,除了可以用关键词、序列相似性等搜寻外,还允许使用者浏览数据库中所有的资料。BIND在收录资料时主要是利用文献,他们提供PreBIND这个工具,使用者可用PreBind浏览他们正在处

理的一些可能的交互作用,所提供的文献链接,让使用者可自行判断所寻求的相互作用是否为真。

PubGeneTM是一个文献数据库,收录可能有关的基因或其蛋白质产物。它利用的假设是:两个基因的名字若出现在同一篇文章内,就可能代表它们相关,因此计算同时出现某两个基因名字的文章篇数,可作为其收录的准则。这个数据库分别收录了人类、小鼠、大鼠中,已知基因的所有两两组合。虽然这样的作法,无法精确地区分两个基因是因为出现在基因组上的邻近位置,或是有相似的基因表达模式,或是蛋白质间可能有的相互作用,却可有助于使用者研究感兴趣但在DIP、BIND中找不到的蛋白质。