6.2.5 TCGA-LUSC 6.2.6 分析 代码gitee地址 参考资料 1.目的 通过实际数据集上的编程实践,掌握高维数据常用的数据探索与可视化技术,观察和理解“维数灾难”问题的涵义、以及相似性度量和维归约的重要性。 2.数据 癌症基因图谱(The Cancer Genome Atlas Program, TCGA)数据库 (https://portal.gdc.cancer.gov/rep...
数据:癌症基因图谱( TCGA)数据库中 5 种不同类型癌症(包括BRCA, BLCA, LGG, LUAD 和 LUSC,每种为一个数据集)病例的 RNA转录组(RNA-seq)数据。 关于数据集的下载在上一篇文章。下载完成后每一个病例都是一个.gz的压缩包。网上大部分关于这个数据库的处理都是用的R语言,自己想尝试一下用Python处理一下。
所以我设置的学徒作业是:下载TCGA数据库中LUSC的转录组信号值矩阵,LUSC病人分成了4类T1-4亚型分别与Normal组做差异分析,就是3*4=12个表达矩阵,12次差异分析,画PCA图,热图,火山图,以及用于差异分析结果比较的Venn图。 下面让我们一起看看一个优秀学徒的表演,该学徒很久以前在我们这里分享过他跨专业进入生信学习圈子...
TCGA是最大的多组学数据集之一,涉及33种不同类型的癌症、超过 20000个样本,包括外显子组测序、RNA 测序、microRNA 测序、拷贝数变异、蛋白质组和甲基化组。已经开发了几种在线工具来提供TCGA数据的生物信息分析。GEPIA2,以在泛癌水平和特定癌症亚型方式上进行基因表达定量。癌症基因组学的cBioPortal包含来自包括TCGA在...
ACC 肾上腺皮质癌、BLCA 膀胱尿路上皮癌、BRCA 乳腺癌、CESC 宫颈鳞状细胞癌和宫颈内膜腺癌;CRC 结直肠癌、HLM 血淋巴样恶性肿瘤,HN/ESCC 头颈部鳞状癌和食管鳞状细胞癌,LIHC 肝癌,LUAD 肺癌,LUSC 肺鳞状细胞癌,MESO 间皮瘤,PAAD 胰腺癌,PRAD 前列腺癌,SKCM 皮肤黑色素瘤,TGCT 睾丸生殖细胞肿瘤,THCA 甲状腺...
TCGA肝癌临床数据资源全面介绍---肝癌研究领域的全谱! 2006年,结核病基因序列所示谱(The Cancer Genome Atlas, TCGA)计划以多形病态胶质母线粒体疣(GBM)、呼吸系统上皮细胞线粒体癌(LUSC)和卵巢浆液病态囊胰脏(OV)开始月份3年的试点项目,2009年~2015年下半年揭开。到项目年末,TCGA在线学术研究工来作者已描绘了...
除了拆分底物数据集,还试着汇总分析首次疗法后无眼疾高血压与非无眼疾高血压前提出现极为相同的一新肿突起血案。TCGA-CDR当中29类大肠恶连续性癌讯息用做解决难题该难题,纳入高血压从安全检查和到收尾首治并远超无眼疾平衡状态至不及活过3个年底。以LUSC为亦然,有289亦然无眼疾高血压和41亦然长期以来非无眼疾高血压...
除了导入分子会统计数据,还越来越进一步分析方法首次用药后无伤寒伤寒人与非无伤寒伤寒人确实浮现相异的取而代之惨案。TCGA-CDR中都29类大肠肿肿电子邮件可用消除该疑问,纳入伤寒人从临床到尚未完成首治并超出无伤寒平衡状态大概存活3个年底。以LUSC为同上,有289同上无伤寒伤寒人和41同上经常性非无伤寒伤寒人,NTE所...
除了导入原子原始数据,还尝试数据分析首次化疗后无染病染病征与非无染病染病征是否经常不止现有所不同的最初暴力事件。TCGA-CDR当中29类肺肿瘤反馈可用消除该疑虑,归属于染病征从诊疗到顺利进行首治并超过无染病状况据估计存活3个同月。以LUSC为唯,有289唯无染病染病征和41唯长期非无染病染病征,NTE赴援合共有21.8...
33种腺癌中都的13种可用全部4个起点:膀胱尿路上皮腺癌(BLCA)、乳头状表皮蛋白质腺癌(CESC)、结肠腺癌(COAD)、食管腺癌(ESCA)、头颈部表皮蛋白质腺癌(HNSC)、肾状蛋白质腺癌(KIRP)、肾腺腺癌(LUAD)、LUSC、OV、胰腺腺癌(PAAD)、肉病变(SARC)、胃部腺腺癌(STAD)和乳房内膜腺癌(UCEC)。忽略,没一个起点的有...