01非冗余蛋白质序列数据库(Non-Redundant Protein Sequence Database, NR)注释NR数据库是美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)维护的一个用于存储和提供蛋白质序列信息的数据库。它包括了GenBank基因的蛋白编码序列,PDB(Protein Data Bank)蛋白数据库、SwissProt蛋白序列以及来...
NR数据库中包含的序列来自不同的生物种类,因此在注释过程中可能会出现物种信息中包含种和属的情况。在分类学中,生物学上的组织结构被分为七个级别,分别是:物种、属、科、目、纲、门和界。种是分类学中最小的分类单位,属则是位于物种级别以上的一个分类单位,通常族属分类。在注释NR数据库中的序列时,系统往往会...