CCLE数据库:Cancer Cell Line Encyclopedia,癌症细胞百科全书。数据库包含各种人源肿瘤细胞系的WES数据,WGS数据,RNAseq数据,扩增子数据等等。网址:https://portals.broadinstitute.org/ccle 以LDHA为例,输入基因名后可以获取细胞系中LDHA的情况,并且所有数据都可以下载。数据库
CCLE主要用来查看表达谱的数据,比如: 查看不同cancer cell type中某个基因的表达,主页直接输入要查询的gene名或ID即可。 CCLE主页 这里提一句RNA-seq~ RNA-Seq的基本假设是什么?简单来说就是对 细胞/组织/个体 的两种不同状态进行比较,寻找差异表达gene,然后从差异表达gene来推断造成生理状态不同的原因。 举个例...
1. Distribution by Lineage 该部分用于比较基因对应的组学数据在不同细胞系间的分布,包含了以下几种 Achilles shRNA knockdown Copy Number DNA methylation (RRBS) Protein Array (RPPA) mRNA expression (Affy) mRNA expression (RNAseq) 以mRNA的表达量为例,结果示意如下 2. Scatter Plots 该部分用散点图展示...
在CCLE中,可以获取到丰富多样的数据,比如RNA-seq。RNA-Seq通过比较细胞/组织/个体的两种不同状态,寻找差异表达基因,进一步推断造成生理状态差异的原因。例如,通过分析TP53在不同癌症细胞系中的表达情况,可以发现TP53基因在所有癌症类型中表达均较高。TP53基因编码的蛋白质在细胞周期启动过程中发挥关键作...
, (2019). The UCSCXenaTools R package: a toolkit for accessing genomics data #> from UCSC Xena platform, from cancer multi-omics to single-cell RNA-seq. #> Journal of Open Source Software, 4(40), 1627, https://doi.org/10.21105/joss.01627 #> === #> --Enjoy it-- #> Try queryi...
文章标题是:《Pan-cancer single-cell RNA-seq identifies recurring programs of cellular heterogeneity》,链接是 nature.com/articles/s41 值得细读! 这个研究数据整理的非常好,可以下载的数据真多:singlecell.broadinstitute.org 重要的应该是下面的文件 : CCLE_scRNAseq_github.zip CPM_data.txt CPM - post-QC...
数据处理 (获取表达矩阵) 我们打开R语言,开始导入数据 library(rio) x1<- import('CCLE_RNAseq_rsem_genes_tpm_20180929.txt') head(x1)[1:10,1:10] dim(x1) 数据并不小 boxplot(head(x1[1:10,3:10])) 画个图看看数据,看来有点问题,这个稍后我们处理 ...
数据处理 (获取表达矩阵) 我们打开R语言,开始导入数据 library(rio) x1<- import('CCLE_RNAseq_rsem_genes_tpm_20180929.txt') head(x1)[1:10,1:10] dim(x1) 数据并不小 boxplot(head(x1[1:10,3:10])) 画个图看看数据,看来有点问题,这个稍后我们处理 ...
CCLE_scRNAseq_github.zip CPM_data.txtCPM-post-QChuman Metadata.txt UMIcount_data.txt 还有区分了各个细胞系的文件: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 tSNE_Bile_Duct_Cancer.txt(tSNE Bile Duct Cancer)tSNE_Bladder_Cancer.txt(tSNE Bladder Cancer)tSNE_Bone_Cancer.txt(tSNE Bone Cance...