为了便于在用户创建的管道中使用协调数据,可以在GDC数据门户中的几个中间步骤中访问RNA-Seq基因表达。以下是可在GDC Data Portal中下载的每种文件类型的说明。 参开资料: 1.https://docs.gdc.cancer.gov/Data/Bioinformatics_Pipelines/Expression_mRNA_Pipeline/ TCGA mRNA数据分析流程mp.weixin.qq.com/s?__bi...
首先将reads与GRCh38 reference genome 参考基因组比对,然后通过量化比对的reads产生这些值。为了促进样品间归一化,所有RNA-Seq读数在分析过程中都被视为unstranded的状态. 二、数据处理步骤 1. RNA-Seq 比对流程 以Alignment Workflow 开始比对的流程, 该流程使用STAR 中重复比对方法执行. STAR 分别比对每个 read gro...
Non-stranded RNA-Seq与Stranded RNA-seq的建库方法有所不同,有文献(DOI: 10.1186/s12864-015-1876-7)分析认为Stranded RNA-seq 得到的mRNA数据更为准确。 但是,对于大多数的分析来说,Non-stranded RNA-Seq数据用于常规分析已经足够(https://web.azenta.com/stranded-vs-non-stranded-rna-seq)。 Stranded RNA-...
每个文件夹里面会有一个star_gene_counts.tsv,我们可以随便打开一个看一下,这个文件的内容跟老版本的完全不一样,包含的信息更多。甚至包含了RNA类型,这样就能很容易的区分mRNA和lncRNA了,另外还包含的基因的名字,再也不用担心ID转换问题了。 这里除了有STAR-counts,还有TPM,FPKM和FPKM_UQ。这几个数据的具体计算方...
Non-stranded RNA-Seq与Stranded RNA-seq的建库方法有所不同,有文献(DOI: 10.1186/s12864-015-1876-7)分析认为Stranded RNA-seq 得到的mRNA数据更为准确。 但是,对于大多数的分析来说,Non-stranded RNA-Seq数据用于常规分析已经足够(https://web.azenta.com/stranded-vs-non-stranded-rna-seq)。
首先将reads与GRCh38 reference genome 参考基因组比对,然后通过量化比对的reads产生这些值。为了促进样品间归一化,所有RNA-Seq读数在分析过程中都被视为unstranded的状态. 二、数据处理步骤 1. RNA-Seq 比对流程 以Alignment Workflow 开始比对的流程, 该流程使用STAR 中重复比对方法执行. STAR 分别比对每个 read ...
TCGA大作战——初步分析RNA-seq数据01 本篇为第一部分,主要记录重要资源地址以及TCGA数据的下载方式。名词及资源TCGA (The Cancer Genome Atlas):人类癌症基因组图谱,数据库,主要用来收集癌症病人癌组织及癌旁正常组织标本以及极少量正常人相应组织的对照标本(并非每种癌都有),通过多种高通量方法,获取DNA、RNA乃至...
1.TCGA RNA-seq数据更新情况 2022年3月29日,GDC官网(https://portal.gdc.cancer.gov/)发布了新的更新版本(Data Release 32.0)数据。此次数据更新范围广、变化大,导致许多网上的教程一夜之间不再直接可用。 具体的更新情况,在官网页面(https://docs.gdc.cancer.go...
一、确定肿瘤代码 TCGA涵盖30多种癌症,9000多个病人,数据库里的癌症名称是缩写的... 基因组学研究生阅读 842评论 1赞 0 如何从TCGA数据库下载DNA甲基化数据 前面给大家介绍了新版的TCGA数据库,通过文字和视频给大家讲解了如何从TCGA数据库下载RNAseq数据,miRN... 生信交流平台阅读 1,086评论 0赞 3 下载TCGA ...
首先下载RNA-Seq: 下载之后共得到1215个样本表达数据 进一步下载临床病理资料 进一步点击 ClinicalFull按钮对病理资料进行提取得到ClinicalFull_matrix.txt文件,使用Excel打开ClinicalFull_matrix.txt文件可以看到共有301列信息,包含了各种用药,随访,预后等等信息,我们这里选择乳腺癌ER、PR、HER2的信息,去除其他用不上的信息,然...