新基因功能注释 Nr/Nt/GO/Kegg/Swiss-Prot/COG/KOG/eggNOG/Pfam/String/转录因子预测数据库的搭建 一、新基因发掘基于所选参考基因组序列,使用StringTie软件对Mapped Reads进行拼接,并与原有的基因组注释信息进行比较,寻找原来未被注释的转录区,发掘该物种的新转录本和新基因,从而补… 生信狗的修..
COG数据库通过比对识别蛋白功能,而COG的分类信息和详细数据则在fun2003-2014.tab等文件中提供。KOG是真核生物蛋白聚类,其功能分析基于基因组相似性。EggNOG扩展了COG,提供全基因组范围的直系同源组注释,适用于谱系特征基因分析。下载EggNOG数据库时,注意使用NCBI Taxid进行物种分类。Pfam数据库则根据蛋...
同时将orthologous group 的概念推广到了真核生物中,根据7个真核生物的蛋白序列构建了真核生物中的同源蛋白簇, 全称为eukaryotic orthologous groups, 简称KOG。 之后又陆续在不同类型的物种中建立起相关的同源蛋白簇。古菌中的同源蛋白簇简称为arCOG, 噬菌体中的同源蛋白簇简称为POG,感染真核生物的病毒中的同源蛋白...
所以比对结果中,很多序列比对上了KOG数据库,但是没有protein编号;而在比对到COG数据库时会好很多。(这里可以说清楚blast比对的结果数和最终整合完毕之后跟cog注释上的不一样的原因) 所以,可以先将序列比对到COG数据库,得出分类数据;然后将没有分类编号的序列挑选出来,再比对到KOG数据库,得出分类数据;然后将两个分类...
COG 是原核数据库,KOG是真核数据库,注释看物种走
eggNOG(evolutionary genealogy of genes:Non-supervised Orthologous Groups,http://eggnog.embl.de/)数据库:是国际上普遍认可的同源聚类基因群的专业注释数据库,包括来⾃原始COG/KOG的功能分类,以及基于分类学的功能注释。⽬前该数据库(v4.0)包含170万个直系同源类群,覆盖了3686个物种,给定了107个不同的...
COG (clusters of orthologous groups)主要是原核生物和单细胞真核生物的直系同源物,KOG(clusters of euKaryotic Orthologous Groups)数据库包含了7个完整基因组的真核生物的直系同源家族蛋白, 构成每个 KOG 的蛋白集是被假定为来自于一个祖先蛋白,根据系统发生进行分类,一般COG指原核生物,KOG指真核...
KOG KOG:EuKaryotic Orthologous Groups(为什么不叫EOG?问号脸)。广义上COG分为真核和原核生物两类,原核的一般称为COG数据库,真核的一般称为KOG数据库。 COG COG:Clusters of Orthologous Groups of proteins,即同源蛋白簇,是NCBI的一个数据库。根据生物完整基因组的编码蛋白系统进化关系分类构建而成,每一簇COG由直...
eggNOG 数据库包含了丰富的注释信息,除了COG/KOG/NOG的分类和注释信息外,还包含了KEGG/GO/SMART/PFAM信息。 新版本的EggNOG 还提供了自动化注释工具eggnog-mapper,可很方便的完成基因组的功能注释,注释信息可以关联COG/KOG/KEGG/GO/BiGG等。 怎样注释的 ...