1.首先进入TCGA官网 TCGA官网网址:GDC (cancer.gov)[https://portal.gdc.cancer.gov/] 2.注意所圈出的Cart,如果C...
1.打开TCGA官网https://portal.gdc.cancer.gov/。在搜索框输入chol,选择第一个PR(project),TCGA-CHOL 2.在跳转的页面中,点击RNA-Seq后面的数字 3. 在新打开的页面中,点击左上角的Files 4.接下来就是不一样的地方了,可以看到在workflow type里面没有HTSeq-Counts了,取而代之的是STAR-Counts。我们就选择这个...
Non-stranded RNA-Seq与Stranded RNA-seq的建库方法有所不同,有文献(DOI: 10.1186/s12864-015-1876-7)分析认为Stranded RNA-seq 得到的mRNA数据更为准确。 但是,对于大多数的分析来说,Non-stranded RNA-Seq数据用于常规分析已经足够(https://web.azenta.com/stranded-vs-non-stranded-rna-seq)。 Stranded RNA-...
RPKM/FPKM方法:10^3标准化了基因长度的影响,10^6标准化了测序深度的影响。 FPKM方法与RPKM类似,主要针对双末端RNA-seq实验的转录本定量。在双末端RNA-seq实验中,有左右两个对应的read来自相同的DNA片段。在进行双末端read进行比对时,来自同一DNA片段的高质量的一对或单个read可以定位到参考序列上。为避免混淆或多次...
☞R代码合并新版TCGA数据库RNAseq表达谱数据 ☞零代码合并新版TCGA数据库RNAseq表达谱数据 最近小编在基于合并的表达谱数据做下游分析的时候,发现了一个很诡异的事情。想把合并的表达矩阵再读到R里面,得到了一个error count=read.table("RNAseq_STARcounts.txt",header=T,sep="\t",row.names=1) ...
☞零代码合并新版TCGA数据库RNAseq表达谱数据 最近小编在基于合并的表达谱数据做下游分析的时候,发现了一个很诡异的事情。想把合并的表达矩阵再读到R里面,得到了一个error 代码语言:javascript 复制 count=read.table("RNAseq_STARcounts.txt",header=T,sep="\t",row.names=1) ...
1.TCGA RNA-seq数据更新情况 2022年3月29日,GDC官网(https://portal.gdc.cancer.gov/)发布了新的更新版本(Data Release 32.0)数据。此次数据更新范围广、变化大,导致许多网上的教程一夜之间不再直接可用。 具体的更新情况,在官网页面(https://docs.gdc.cancer.g...
1.TCGA RNA-seq数据更新情况 2022年3月29日,GDC官网(https://portal.gdc.cancer.gov/)发布了新的更新版本(Data Release 32.0)数据。此次数据更新范围广、变化大,导致许多网上的教程一夜之间不再直接可用。 具体的更新情况,在官网页面(https://docs.gdc.cancer.gov/Data/Release_Notes/Data_Release_Notes/)有详...
名词及资源TCGA (The Cancer Genome Atlas):人类癌症基因组图谱,数据库,主要用来收集癌症病人癌组织及癌旁正常组织标本以及极少量正常人相应组织的对照标本(并非每种癌都有),通过多种高通量方法,获取DNA、RNA乃至蛋白多个分子层面的数据;另一方面,它还收集了病人的临床宏观层面信息(诸如肿瘤的分期和分级,患者生存时间...
然后筛选非N/A的就得到了这一百个样本对于的RNA-seq数据信息 进一步删除其他的样本,还原成fileID.tmp格式保存退出: 然后使用TCGA简易小工具“合并文件”按钮就得到表达矩阵了,进一步使用ENSD_ID转换按钮就得到了基因表达矩阵和lncRNA表达矩阵了 ###R代码实现WGCNA### setwd('E:/rawData/TCGA_DATA/TCGA-BRCA...