数据库链接:ftp://ftp.ncbi.nih.gov/pub/COG/KOG/kyva。 wget -c ftp://ftp.ncbi.nih.gov/pub/COG/* 7. eggNOG数据库 7.1 简单介绍 eggNOG数据库是直源同系蛋白分组比对(evolutionary genealogy of genes: Non-supervised Orthologous Groups)数据库,由EMBL创建并维护,是对NCBI的COG数据库进行拓展,提供...
所以,可以先将序列比对到COG数据库,得出分类数据;然后将没有分类编号的序列挑选出来,再比对到KOG数据库,得出分类数据;然后将两个分类数据进行整合,然后画出COG分类图。 五、COG的注释 1,使用Webmga http://weizhongli-lab.org/metagenomic-analysis 会反馈给你4个结果,output.1和output.2分别是两个非常相近的比对...
2003年的时候,又根据66个细菌物种的蛋白序列,对之前的COG结果进行了补充和拓展。 同时将orthologous group 的概念推广到了真核生物中,根据7个真核生物的蛋白序列构建了真核生物中的同源蛋白簇, 全称为eukaryotic orthologous groups, 简称KOG。 之后又陆续在不同类型的物种中建立起相关的同源蛋白簇。古菌中的同源蛋白...
COG数据库通过比对识别蛋白功能,而COG的分类信息和详细数据则在fun2003-2014.tab等文件中提供。KOG是真核生物蛋白聚类,其功能分析基于基因组相似性。EggNOG扩展了COG,提供全基因组范围的直系同源组注释,适用于谱系特征基因分析。下载EggNOG数据库时,注意使用NCBI Taxid进行物种分类。Pfam数据库则根据蛋...
原核生物的一般称为COG数据库;真核生物的一般称为KOG数据库。由NCBI创建并维护的蛋白数据库,根据细菌、藻类和真核生物完整基因组的编码蛋白系统进化关系分类构建而成。通过比对可以将某个蛋白序列注释到某一个COG中,每一簇COG由直系同源序列构成,从而可以推测该序列的功能。COG数据库按照功能一共可以分为二十六类。
COG (clusters of orthologous groups)主要是原核生物和单细胞真核生物的直系同源物,KOG(clusters of euKaryotic Orthologous Groups)数据库包含了7个完整基因组的真核生物的直系同源家族蛋白, 构成每个 KOG 的蛋白集是被假定为来自于一个祖先蛋白,根据系统发生进行分类,一般COG指原核生物,KOG指真核...
eggNOG(evolutionary genealogy of genes:Non-supervised Orthologous Groups,http://eggnog.embl.de/)数据库:是国际上普遍认可的同源聚类基因群的专业注释数据库,包括来自原始COG/KOG的功能分类,以及基于分类学的功能注释。目前该数据库(v4.0)包含170万个直系同源类群,覆盖了3686个物种,给定了107个不同的分类...
测了一个真菌的全序列,想对全蛋白做一个COG(clusters of orthologous groups) 或者 KOG的分类,查询了下,有说可以做批量运行的,但是NCBI上只看到单个运行的界面(http://www.ncbi.nlm.nih.gov/COG/old/xognitor.html),不知哪位了解的能够指点下!不胜感激~...
KOG:EuKaryotic Orthologous Groups(为什么不叫EOG?问号脸)。广义上COG分为真核和原核生物两类,原核的一般称为COG数据库,真核的一般称为KOG数据库。 COG COG:Clusters of Orthologous Groups of proteins,即同源蛋白簇,是NCBI的一个数据库。根据生物完整基因组的编码蛋白系统进化关系分类构建而成,每一簇COG由直系同源...