CopyKAT(肿瘤拷贝数核型分析)是一种使用综合贝叶斯方法的计算工具,能够在单细胞中以5MB分辨率检测全基因组非整倍体,以便从高通量单细胞RNA测序数据中区分肿瘤细胞与正常细胞,并识别肿瘤亚克隆。 (这里提一下,“5MB”是指 5兆碱基对(5 megabase pairs, 5 Mb),表示基因组上5百万个碱基对的区域。这个分辨率意味着Co...
在这种情况下,CopyKAT提供了一种GMM定义模式来逐一识别二倍体正常细胞,假设一个细胞的基因表达中混合有3种高斯模型:增加、缺失和中性状态。当处于中性状态的基因至少占表达基因的99%时,该细胞就被定义为高置信的二倍体细胞。通过对单细胞拷贝数数据进行分层聚类,以识别非整倍体肿瘤细胞和二倍体基质细胞之间的最大距...
CopyKAT分析单细胞测序CNV不需要向infercnv设置正常细胞对照,它会根据哪些细胞为二倍体就自动作为正常细胞,以推测恶性细胞的CNV。 >sc_cnv=copykat(rawmat=counts,ngene.chr=5,sam.name='CRC',n.cores=20)[1]"running copykat v1.0.8 updated 02/25/2022 introduced mm10 module, fixed typos"[1]"step1: r...
2021年1月发表于nature biotechnology,影响因子36分多,非常高,前几位的作者都是中国人,非常值得一看,文章中推出新的推断肿瘤细胞CNV的方法:copyKAT,也是通过单细胞转录组数据来推断细胞的染色体倍数,进而推断是正常细胞(diploid)还是肿瘤细胞(aneuploid)。
接下来,研究人员将CopyKAT应用于三组之前已经发表的肿瘤研究相关的单细胞转录组数据:5例胰腺癌患者、5例三阴性乳腺癌患者以及5例间变性甲状腺癌患者的3’单细胞转录组测序数据,期待根据CopyKAT预测的拷贝数差异来区分肿瘤细胞和正常细胞。 结果...
测试完成,能够正常使用copykat进行单细胞数据分析,并且能够充分调用服务器计算资源,计算速度相对比较快,通过这个方式能够进行更大规模的单细胞数据分析。 [1] "running copykat v1.1.0" [1] "step1: read and filter data ..." [1] "36601 genes, 1615 cells in raw data" [1] "filtered out 106 cells ...
对于肿瘤的单细胞样本,在做完细胞质控和细胞类型鉴定之后,可以进入CNV分析。在统计学上,CopyKAT将贝叶斯方法与层次聚类相结合,计算单个细胞的基因组拷贝数分布,并从高通量单细胞转录组数据中定义克隆子结构。 首先,单细胞转录组数据的Unique Molecular Identifier(UMI)的基因表达矩阵作为CopyKAT的输入,...
开始分析,如10X Cellranger输出的格式。在解读结果时,肿瘤细胞的非整倍体被预测为异常,而二倍体细胞视为正常细胞,通过热图可以进一步定义肿瘤细胞的亚克隆群体及其基因表达差异。让我们共同期待CopyKAT在单细胞转录组CNV分析中的应用,希望疫情早日结束,大家可以更深入地交流和探索这一领域的最新进展。
在高级分析中,我们可以利用inferCNV和CopyKAT对单细胞进行CNV(Copy number variation, 拷贝数变异)分析,区分肿瘤细胞与非肿瘤细胞。 CNV是基因组结构变异(Structural variation,SV)的重要组成部分,主要原因是基因组发生重排,一般指长度为1kb以上的基因组大片段的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重复。CNV...
其实我们在教程:CNS图表复现09—上皮细胞可以区分为恶性与否提到了五千多个上皮细胞里面只有三千七百左右是恶性细胞,但是 copykat 和 infercnv这两个从单细胞转录组数据推断肿瘤拷贝数变异技术差异还没有被探索过。 构建两个算法都需要的输入数据 其中infercnv 算法需要3个文件,但是 copykat 只需一个文件即可,我们这里...