功能富集分析 ORA | clusterProfiler 读取本地化KEGG数据 bulk RNA-seq | 下游分析 | 基因集富集分析 GSEA- clusterProfiler 下面接着记录GSVA与ssGSEA方法。这一部分之前也写过:ssGSEA与GSVA使用方法,主体内容还是那些,一个更新原因是不知道为什么,GSVA包(支持GSVA、ssGSEA、zscore与plage等多种方法)的作者更新了函...
rownames(DEG_DESeq2_2) <- DEG_DESeq2_2$SYMBOL#[1] 19249 9 这时准备基因排序向量时需要小心去除转换失败的基因。 DEG_DESeq2_2 <- na.omit(DEG_DESeq2_2[,c("log2FoldChange","ENTREZID")]) DEG_DESeq2_2 <- DEG_DESeq2_2[order(DEG_DESeq2_2$ENTREZID),] DEG_DESeq2_2 <- DEG...
RNA-seq下游分析 count_matrix图 Hh1图 matadata图 znk4图 res图 res1图 entrezid_log2fdc图 gseaKEGG_results图 go.res图 aaa图 library(DESeq2)count_matrix<-read.table("D:/R/1/c.txt",quote="\"")colnames(count_matrix)[1]='gene_id'class(count_matrix)Hh1<-count_matrix[,c(1,2,5,8...
RNAseq下游分析--edgeR +cluserprofiler 生信编程日常关注IP属地: 上海 0.7072019.12.18 21:01:05字数97阅读1,263 RNAseq分析可以用hisat2+samtools+stringtie得到表达矩阵,后面可以通过edgeR + clusterprofiler分析。 source("https://bioconductor.org/biocLite.R")#install biocLite("edgeR") library(edgeR) library...
基于上游分析获得表达矩阵后,就可以进行差异分析了,最基础的莫过于利用DEseq2包寻找差异基因。学习自b站视频生信技能树转录组视频~ 0、数据准备及前处理 由于目前在家不方便获得数据,因此参照教学视频使用airway包的现成数据。 如链接中官方介绍,airway包背景是使用地塞米松处理的四个人气道(支气管?)平滑肌细胞(即共8个...
学习完snakemake后写的第一个流程是RNA-seq上游定量和下游的质控和差异分析。 使用fastp处理fastq文件,在使用START比对到基因组同时得到raw count,使用非冗余外显子长度作为基因的长度计算FPKM、TPM,同时也生成了CPM的结果。 非冗余外显子长度计算可以参考之前的推文转录组实战02: 计算非冗余外显子长度之和 ...
转录组测序成本降低,使得越来越多实验团队尝试RNA-seq,以期发现新思路。分析流程分为上游和下游,前者依赖服务器,后者则能通过R语言和相关包轻松完成。加载转录组测序数据,通常为测序后产生的计数矩阵,通过公司获取或从TCGA肿瘤数据库下载获得,确保数据为数据框格式。构建metadata文件指示分组信息,是进行...
Oncogenic lncRNA downregulates cancer cell antigen presentation and intrinsic tumor suppression不过不需要看文章,大家只需要做差异分析即可,这个时候需要注意的是,作者提供的是RPKM值表达矩阵! 1.下载数据GSE113143并加载数据 代码语言:javascript 复制 a=read.table('GSE113143_Normal_Tumor_Expression.tab.gz',sep=...
先期通过TCGA下载得到HT-Seq的测序数据,主要是COUNT的数据,经过整理变换后得到Rdata数据文件(已整合)。此文为接续下来的分析步骤。 一、加载数据 load(file="expr_df.Rdata")## 此处根据实际写入数据库路径 这个数据就是测序后的counts矩阵,可以通过测序公司取得相关数据。