2公共RNA-seq数据采集和质控 为了预测基因和HPO表型关联的功能,下载了欧洲核苷酸档案(ENA)中公开获得的所有人类样本RNA-seq数据。通过使用Kallisto对基因表达进行定量,并且去除了有限数量的映射读数的样品。相关矩阵上的主成分分析(PCA)用于去除低质量样品并去除错误注释为RNA-seq但被证明是DNA-seq的样品。最后,纳入31,...
RNA-seq数据从Count表达矩阵开始进行数据清洗整理、样本聚类分析、PCA分析、特定基因表达、差异表达分析、通路富集分析(GO、KEGG)及GSEA分析; 将以上数据分析结果进行聚类热图、PCA图、箱线图、富集分析(个性化展示)气泡图和柱状图、单样本及多样本GSEA分析图; 将课程内容学懂吃透,融会贯通后,具备为别人提供RNA-seq数据...
这需要较少数量的微阵列或RNA seq 库(使用1385个微阵列样本,CoNekT使用913个RNA序列样本),ARS可以通过简单的“Google-like”搜索从20000多个拟南芥RNA seq-101文库中快速提取任意基因的丰度信息,并对组织102特异性、发育阶段、胁迫相关以及突变体和103种治疗方法的差异表达进行多重可视化。
RNA-seq数据从Count表达矩阵开始进行数据清洗整理、样本聚类分析、PCA分析、特定基因表达、差异表达分析、通路富集分析(GO、KEGG)及GSEA分析; 将以上数据分析结果进行聚类热图、PCA图、箱线图、富集分析(个性化展示)气泡图和柱状图、单样本及多样本GSEA分析图; 将课程内容学懂吃透,融会贯通后,具备为别人提供RNA-seq数据...
本文研究思路: 1) 收集公共RNA-seq数据,对数据质控;2)预测HPO表型关联和基因功能;3)对已知或未知致病基因进行排序;4)使用基因可测性评分来解释GADO的差异表现;5)HPO表型聚类;6)使用GADO预测致病基因,并做出验证;7)重新分析未解决案例,并与其他方法进行比较。
原名:A comprehensive online database for exploring ~20,000 public 1 Arabidopsis RNA-Seq libraries 译名:一个综合在线数据库,用于探索~20000个公共1拟南芥RNA序列文库 期刊:Molecular Plant IF:12.084 发表时间:2020.08.04 通讯作者:翟继先 通讯作者单位:南方科技大学生物系植物与食品研究所 ...