NR/NT 数据库 NR(Non-Redundant Protein Sequence Database)非冗余蛋白库,所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列,对于所有已知的或可能的编码序列,NR记录中都给出了相应的氨基酸序列(通过已知或可能的读码框推断而来)以及专门蛋白数据库中的序列号。NR库相当于一个以核酸序列为基础的交叉索引,将核酸数据和蛋...
NR/NT 数据库 NR(Non-Redundant Protein Sequence Database)非冗余蛋白库,所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列,对于所有已知的或可能的编码序列,NR记录中都给出了相应的氨基酸序列(通过已知或可能的读码框推断而来)以及专门蛋白数据库中的序列号。NR库相当于一个以核酸序列为基础的交叉索引,将核酸数据和蛋...
1.GenBank与RefSeq GenBank是NIH遗传序列数据库,集成了所有公开可获得的已注释DNA序列。GenBank收录的核酸序列数据根据其不同的研究属性,分属于Nucleotide、GSS和EST三个子库(可从NCBI主页下拉菜单中登录和查询)。Nucleotide收录绝大多数常规的核酸序列;GSS(Genon ne Survey Sequence)收录测序起始阶段用来进行序列或...
GenBank中存储了上亿条基因组、基因和蛋白质序列信息。 Sequence Read Archive(SRA):这个数据库存储了大量的高通量测序数据,包括DNA片段测序、RNA测序和蛋白质测序等信息,研究人员可以在其中找到适合自己研究的数据集。 Protein Data Bank(PDB):这是一个蛋白质三维结构数据库,存储了大量的蛋白质结构信息。研究人员可以...
NCBI(美国国家生物技术信息中心)的资源架构(下篇)
Genbank与RefSeq:Genbank(基因银行)含有所有公开的已注释DNA序列,与EMBL[3]和DDBJ[4]并称世界三大生物序列信息数据库,三者组成了INSDC[5],并且三个数据库的数据可进行交换与共享。GeneBank包括Nucleotide等子数据库。但是GeneBank由用户提交的数据构成,具有较高的冗余度和差错率,为了更好的实现查询,NCBI在GeneBank基础...
NR(Non-Redundant Protein Sequence Database)非冗余蛋白库,所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列,对于所有已知的或可能的编码序列,NR记录中都给出了相应的氨基酸序列(通过已知或可能的读码框推断而来)以及专门蛋白数据库中的序列号。NR库相当于一个以核酸序列为基础的交叉索引,将核酸数据和蛋白数据联系起来。
这些数据库包括NCBI的流感病毒序列数据库(InfluenzaVirusSequenceDatabase),该数据库收录有GenBank 34、和RefSeq中超过70,000条流感病毒的序列。科研人员借助流感病毒资源提供的各种工具能对超过83,000条流感蛋白质序列进行分析。Entrez的生物学数据库中还收录有超过100条流感病毒蛋白质结构信息和350多条有关流感病毒种群...
这些数据库包括NCBI的流感病毒序列数据库(Influenza Virus Sequence Database),该数据库收录有GenBank和RefSeq中超过70,000条流感病毒的序列。科研人员借助流感病毒资源提供的各种工具能对超过83,000条流感蛋白质序列进行分析。Entrez的生物学数据库中还收录有超过100条流感病毒蛋白质结构信息和350多条有关流感病毒种群...
Entrez Nucleotide数据库含有除了收录之外的GenBank中所有的序列,它还收录有全基因组鸟枪法测序序列、第三方注释序列(Third Party Annotation sequences)和Entrez结构数据库中的序列。对这些记录中编码序列概念上的翻译信息都收录在了Entrez蛋白质数据库中。EST数据库收录了GenBank EST中的所有数据和没有生物学注释信息的...