8.3 NCBI疾病数据集计算性能分析 BERT-Base的参数超过1亿,对于普通的PC(只包含CPU)几乎是跑不动的,对于包含GPU的PC(8G显存以下)的,Batch Size基本只能设置为<=4。RTX 3080的机器Batch Size可以设置为8,约占用9.5G的显存。 运行NCBI-Disease数据集(训练集包含3176条记录),一个Epoch的实验数据: 框架数据集数据长...
公共功能基因组数据库,支持符合MIAME标准的数据提交。接受基于芯片和测序数据,并提供工具以帮助用户查询和下载实验数据并研究基因表达谱。 Gene Expression Omnibus (GEO) Datasets 存储从Gene Expression Omnibus(GEO)数据库组装的基因表达和分子丰度数据集。数据集每个记录包含其他资源,包括集群工具和差异表达式查询。 Gene...
公共功能基因组数据库,支持符合MIAME标准的数据提交。接受基于芯片和测序数据,并提供工具以帮助用户查询和下载实验数据并研究基因表达谱。 Gene Expression Omnibus (GEO) Datasets 存储从Gene Expression Omnibus(GEO)数据库组装的基因表达和分子丰度数据集。数据集每个记录包含其他资源,包括集群工具和差异表达式查询。 Gene...
存储从Gene Expression Omnibus(GEO)数据库组装的单个基因表达和分子丰度配置文件。 基于基因注释或预先计算的轮廓特征搜索感兴趣的特定配置。 GeneReviews NCBI Bookshelf上专家撰写的同行评审疾病描述集,将基因检测应用于具有特定遗传病症的患者和家属的诊断,管理和遗传咨询。 Genes and Disease 选定遗传疾病的信息摘要,...
NCBI Bookshelf上专家撰写的同行评审疾病描述集,将基因检测应用于具有特定遗传病症的患者和家属的诊断,管理和遗传咨询。 Genes and Disease 选定遗传疾病的信息摘要,讨论潜在的突变和临床特征,以及相关数据库和组织的链接。 Genetic Testing Registry (GTR)
NCBI Bookshelf上专家撰写的同行评审疾病描述集,将基因检测应用于具有特定遗传病症的患者和家属的诊断,管理和遗传咨询。 Genes and Disease# 选定遗传疾病的信息摘要,讨论潜在的突变和临床特征,以及相关数据库和组织的链接。 Genetic Testing Registry (GTR)# ...
数据分布: ClassesTrain setTest setDev set Modifiers 1292 264 218 Specific Disease 2959 556 409 Composite Mentions 116 20 37 Disease Class 781 121 127 *以上信息来源于ncbi.nlm.nih.gov/CBBres 数据下载地址:github.com/spyysalo/ncb 8.1.1 数据转换 数据的格式如下: [ "Identification", "of", "...