代码语言:javascript 复制 condition_file="data/matedata.csv"condition_df=pd.read_csv(condition_file,index_col=0)condition_df.head() 构建DeseqDataSet 对象,并进行差异分析: 代码语言:javascript 复制 # 构建DeseqDataSet 对象 dds=DeseqDataSet(counts=counts_df,clinical=condition_df,design_factors="type"...
为了更好演示,这里采用与之前bulk RNA-seq | 下游分析 | 差异分析 DESeq2中不同的演示数据。从TCGA-COAD、GTEx各随机抽取5个样本,未去批次、未执行任何分析前过滤。不去批次的数据,GAPDH差异显著,你还敢用吗? DEG[c("GAPDH","KRAS","TP53","A2ML1-AS1","A2ML1-AS2","AA06", "ACTL8","AFAP1-AS1"...
对illumina数据进行处理,利用 RNA-Seq 发现新的 RNA 变体和剪接位点,或量化 mRNA 以进行基因表达分析等。对两组或多组样本的转录组数据,通过差异表达分析和对所发现的差异表达基因集合进行功能富集分析以推断生物学功能。 数据准备: 数据下载: Humangenome(GRCh38/hg3):Index of /goldenPath/hg38/chromosomes (ucs...
bulk RNA-seq | 下游分析 | 基因集富集分析 GSEA- clusterProfilermp.weixin.qq.com/s/Ky6ig9fTp6YdcgQ8ohxN1g 参考文章:bulk RNA-seq | 下游分析 | 基因集富集分析 GSEA- clusterProfiler参考文章: 1、科研小白要知道:新版TCGA数据分析实战——富集分析可视化,GO、KEGG、Reactome、Do、MSigDB的GSEA富集分析...
BulkRNA-seq转录组分析 Reference :我们⾃⼰测得的数据:交代⼀下需要准备的数据:⾸先要有双端测序的.fa.qz⽂件,要⽤⽹上下好的gene注释⽂件,hisat2需要⽤到,具体如何下载,见上⾯两个链接 注:也可以利⽤.fa⽂件⽣成对应的索引⽂件,命令如下:$HISAT_HOME/hisat-build $HISAT_...
bulk-RNAseq的定量 首先来看一下如何使用kallisto来做常规RNAseq的定量,只需两步即可,第一步是构建比对参考基因组(该步骤只需做一次,后面可以直接使用),第二步就是定量(该软件无需单独做一次比对,而是直接将reads比对后定量出结果,在步骤上一气呵成)。下面来看看具体的代码示例: ...
【1】Bulk RNA-seq和scRNA-seq数据收集与预处理 文献解读 TCGA、GEO公共数据下载 差异表达基因分析 富集分析 【翰佰尔生物】翰佰尔生物 立即播放 打开App,流畅又高清100+个相关视频 更多 653 0 00:09 App 2k买的单细胞转录组scRNA-seq全代码流程。共125G。全部分享 2300 0 04:01 App 76. 手把手教学GO...
3. 比对,生成bam文件:“将RNA-seq的测序reads使用hisat2比对对参考基因租组” /home/glab/Shanyr/software/hisat2-2.1.0/hisat2 -p16-x ../../../bulk_rnaseq/jky-z001/refdata-cellranger-hg19-3.0.0/genes/genome_tran -1../neg/neg_R1.fq.gz -2../neg/neg_R2.fq.gz -S ../neg/neg...
Possible values: "RNA-seq", "Affymetrix", "Other" Number of NMF restarts : 5 NMF重新启动次数参数,这是一个非常耗时的过程,这里建议至少设置为50。 Maximum number of states per cell type : 20 每种细胞类型可能的状态数量的上限。 Cophenetic coefficient cutoff : 0.95 ...