• 1.摘要
  • 2.基本信息
  • 3.简介
  • 4.产生的背景
  • 5.特点
  • 6.用途
  • 7.影响及发展
  • 8.KEGG数据库
  • 8.1.KEGG对象标识符
  • 8.2.当前数据库中的记录
  • 9.KEGGPATHWAYDatabase
  • 9.1.PATHWAY的五种类型
  • 9.2.直系同源与旁系同源

KEGG

KEGG 是了解高级功能和生物系统(如细胞、 生物和生态系统),从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源,由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。

基本信息

  • 中文名

    京都基因与基因组百科全书

  • 外文名

    Kyoto Encyclopedia of Genes and Genomes

  • 简称

    KEGG

  • 性质

    基因组破译方面的数据库

  • 成立单位

    日本京都大学生物信息学中心的Kanehisa实验室

  • 成立时间

    1995年

简介

KEGG(京都基因与基因组百科全书)是基因组破译方面的数据库。在后基因时代一个重大挑战是如何使细胞和有机体在计算机上完整的表达和演绎,让计算机利用基因信息对更高层次和更复杂细胞活动和生物体行为作出计算推测。为达到此目的,人们建立了一个在相关知识基础上的网络推测计算工具。在给出染色体中一套完整的基因的情况下,它可以对蛋白质交互(互动)网络在各种细胞活动起的作用作出预测。 KEGG 的PATHWAY 数据库整合当前在分子互动网络(比如通道,联合体)的知识,KEGG 的GENES/SSDB/KO 数据库提供关于在基因组计划中发现的基因和蛋白质的相关知识,KEGG 的COMPOUND/GLYCAN/REACTION数据库提供生化复合物及反应方面的知识。

产生的背景

如何借助计算机全面地展示细胞和生物所包含的生物学信息是后基因组时代的重大挑战之一。科学家期望能够根据基因组中的信息,用计算机计算或者预测出比较复杂的细胞中的通路或者生物的复杂行为。出于这个目的,日本京都大学生物信息学中心的Kanehisa实验室于1995年建立了生物信息学数据库KEGG。

特点

·KEGG是一个整合了基因组、化学和系统功能信息的数据库。把从已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能关联起来是KEGG数据库的特色之一。··人工创建了一个知识库,这个知识库是基于使用一种可计算的形式捕捉和组织实验得到的知识而形成的系统功能知识库。它是一个生物系统的计算机模拟。··与其他数据库相比,KEGG 的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,这样可以使研究者能够对其所要研究的代谢途径有一个直观全面的了解。

用途

各个数据库中包含了大量的有用信息。基因组信息存储在GENES数据库里,包括完整和部分测序的基因组序列;更高级的功能信息存储在PATHWAY数据库里,包括图解的细胞生化过程如代谢、膜转运、信号传递、细胞周期,还包括同系保守的子通路等信息;KEGG的另一个数据库LIGAND,包含关于化学物质、酶分子、酶反应等信息。

通过与世界上其它一些大型生物信息学数据库的连接,KEGG可以为研究者提供更为丰富的生物学信息(LinkDB)。

KEGG提供了Java的图形工具来访问基因组图谱,比较基因组图谱和操作表达图谱,以及其它序列比较、图形比较和通路计算的工具,可以免费获取。

影响及发展

KEGG建立了KEGG直系同源系统(theKEGG Orthology (KO)system),这个系统通过把分子网络的相关信息连接到基因组中,从而发展和促进了跨物种注释流程。·结果表明,KEGG被当做一个参考知识库,被广泛的用于基因组测序和其他高通量实验技术得到的大规模数据集的整合和解释中。除了保持对基础研究的支持,随着KEGG分子网络的一些小变化,KEGG正在朝着更加偏向于实际应用的方向发展,这些应用主要集中在整合人类疾病、药物和其他与健康相关的物质。

KEGG数据库

KEGG是一个综合数据库,它们大致分为系统信息、基因组信息和化学信息三大类。进一步可细分为16个主要的数据库。可以通过不同的颜色编码来区分。

分类

数据库

目录

颜色

系统信息

KEGG PATHWAY

KEGG通路图

KEGG BRITE

BRITE功能层次

KEGG MODULE

KEGG功能单元的模块

KEGG DISEASE

人类疾病

KEGG对象标识符

数据库中包含各种各样的数据对象,这些数据对象是为了用来对生物系统进行计算机模拟的。因此,各个数据库中的数据记录都被称为KEGG对象。这些对象可以通过KEGG对象标识符来识别,标识符由一个与数据库相关的前缀加五个数字构成。

Database

Object

Prefix

Example

KEGG PATHWAY

Pathway map

map, ko, ec, rn, (org)

hsa04930

KEGG BRITE

Functional hierarchy

br, jp, ko, (org)

ko01003

KEGG MODULE

KEGG module

M, (org)_M

M00010

KEGG DISEASE

Human disease

H

H00004

当前数据库中的记录