Non-stranded RNA-Seq与Stranded RNA-seq的建库方法有所不同,有文献(DOI: 10.1186/s12864-015-1876-7)分析认为Stranded RNA-seq 得到的mRNA数据更为准确。 但是,对于大多数的分析来说,Non-stranded RNA-Seq数据用于常规分析已经足够(https://web.azenta.com/stranded-vs-non-stranded-rna-seq)。 Stranded RNA-...
TCGA大作战——初步分析RNA-seq数据01 本篇为第一部分,主要记录重要资源地址以及TCGA数据的下载方式。名词及资源TCGA (The Cancer Genome Atlas):人类癌症基因组图谱,数据库,主要用来收集癌症病人癌组织及癌旁正常组织标本以及极少量正常人相应组织的对照标本(并非每种癌都有),通过多种高通量方法,获取DNA、RNA乃至...
1、TCGA 大作战初步分析 RNA-seq 数据 01本篇为第一部分, 主要记录重要资源地址以及 TCGA 数 据的下载方式。名词及资源 TCGA (The Cancer Genome Atlas) :人类癌症基因组图谱, 数据库, 主要用来收集癌症病 人癌组织及癌旁正常组织标本以及极少量正常人相应组织 的对照标本(并非每种癌都有) ,通过多种高通量方...
Non-stranded RNA-Seq与Stranded RNA-seq的建库方法有所不同,有文献(DOI: 10.1186/s12864-015-1876-7)分析认为Stranded RNA-seq 得到的mRNA数据更为准确。 但是,对于大多数的分析来说,Non-stranded RNA-Seq数据用于常规分析已经足够(https://web.azenta.com/stranded-vs-non-stranded-rna-seq)。 Stranded RNA-...
首先下载RNA-Seq: 下载之后共得到1215个样本表达数据 进一步下载临床病理资料 进一步点击 ClinicalFull按钮对病理资料进行提取得到ClinicalFull_matrix.txt文件,使用Excel打开ClinicalFull_matrix.txt文件可以看到共有301列信息,包含了各种用药,随访,预后等等信息,我们这里选择乳腺癌ER、PR、HER2的信息,去除其他用不上的信息,然...
首先下载RNA-Seq: 下载之后共得到1215个样本表达数据 进一步下载临床病理资料 进一步点击 ClinicalFull按钮对病理资料进行提取得到ClinicalFull_matrix.txt文件,使用Excel打开ClinicalFull_matrix.txt文件可以看到共有301列信息,包含了各种用药,随访,预后等等信息,我们这里选择乳腺癌ER、PR、HER2的信息,去除其他用不上的信息,然...
闭关学习TCGA,想用R语言直接下载TGCA数据库RNA-Seq、基因芯片数据等,不给力的电脑,运行速度太慢,还是建议想搞编程的同学,起码电脑内存8G,200G以上,当然懒人有懒人的处理办法,毕竟目前很多软件都是懒人开发的。TCPA你值得拥有!http://www.tcpaportal.org/tcpa/ ...
3、对RNA-seq数据进行分析,正常肿瘤对比,差异表达基因的筛选,找出肿瘤样本中低表达基因。 4、结合甲基化和RNA-seq数据,将高甲基化和低表达基因取交集,这些基因很可能属于抑癌基因,与抑癌基因取交集,再结合promoter区域的CpG整合分析,寻找候选靶标。 5、对找出的靶标进行验证,利用pubmed以及其他数据库,反向验证靶标...
1.TCGA RNA-seq数据更新情况 2022年3月29日,GDC官网(https://portal.gdc.cancer.gov/)发布了新的更新版本(Data Release 32.0)数据。此次数据更新范围广、变化大,导致许多网上的教程一夜之间不再直接可用。 具体的更新情况,在官网页面(https://docs.gdc.cancer.go...
RNA-seq数据:泊松分布密度函数 而且,GSVA是为每个样本的每个基因计算对应的CDF值,然后根据该值对基因进行排序,这样,每个样本都有一个从大到小排序的基因列表 对于某一基因集合,计算其在每个样本中的ES值,也就是评估基因集合在基因列表中的富集情况。 例如,我们有一个排序后的样本 ...