[translate] a 提出了适合随机森林模型的FDR估计方法,模拟实验表明其具有较高的准确性,相比较于单变量FDR估计方法,变量相关对其估计准确性并无影响。使其更具有实用性。[translate]
随机森林模型1. Random Forest model was used to explore the hypervariable sites between groups. 方法根据相关文献提供的实验结果,将54株H5N1病毒株按其对哺乳动物的毒力强弱分为高毒力组和低毒力组,在NCBI Genbank数据库中下载HA基因序列,用随机森林模型完成主要变异氨基酸位点的筛选。
a方法 利用R语言编程,验证三种单变量FDR估计方法在两种模拟条件下的估计精度。编写R程序进行模拟实验研究随机森林变量重要性评分分布的特点。在此基础上确定最终随机森林模型的FDR估计方法,并通过模拟实验比较其估计值和真实值的差别。利用代谢组学实例数据验证该方法的有效性。 正在翻译,请等待...[translate]...