rainfallPlot(maf=laml,detectChangePoints=TRUE,pointSize=0.6) 6 Compare mutation load against TCGA cohorts 通过tcgaComapre函数实现laml(自有群体)与TCGA中已有的33个癌种队列的突变负载情况的比较。 #cohortName 给输入的队列命名 laml.mutload=tcgaComp...
laml = read.maf(maf="STAD.mutectAdjustBarcode.maf.txt",clinicalData="clinical.STAD.tsv")#read.maf()函数有两个最关键的参数maf,clinicalData,这个两个数据框只需要共同的Tumor_Sample_Barcode,这个一点用起来非常方便,很多帖子并没有提到此处,详细信息可参考maftools的官网。注意:TCGA直接下载的maf文件第16列...
maf) #查看数据的基本情况 laml An object of class MAF ID summary Mean Median 1: NCBI_Build 1 NA NA 2: Center 1 NA NA 3: Samples 364 NA NA 4: nGenes 12704 NA NA 5: Frame_Shift_Del 1413 3.893 3 6: Frame_Shift_Ins 551 1.518 1 7: In_Frame_Del 277 0.763 0 8: In_Frame_Ins...
1.3 maf文件绘制词云图 如果使用maftools中的maf文件绘制呢?首先根据maftools|TCGA肿瘤突变数据的汇总,分析和可视化得到了laml数据,那么可以用以下方式获得基因云图 代码语言:javascript 代码运行次数:0 运行 AI代码解释 library(wordcloud2)data2<-as.data.frame(table(laml@data$Hugo_Symbol))da2<-subset(data2,Freq...
laml An object of class MAF ID summary Mean Median 1: NCBI_Build 1 NA NA 2: Center 1 NA NA 3: Samples 364 NA NA 4: nGenes 12704 NA NA 5: Frame_Shift_Del 1413 3.893 3 6: Frame_Shift_Ins 551 1.518 1 7: In_Frame_Del 277 0.763 0 ...
LAML患者的正常组织样本(皮肤活检)通常含有富含肿瘤细胞的血液。这可能导致variant calling 程序将体细胞突变错误地标记为germline。MC3 pipeline 是保守的,试图删除所有假阳性的germline calling 。TCGA LAML AWG创建的原始MAF的大部分都是通过手工干预获得的,包括不包含在TCGA数据目录中的Sanger测序数据,以恢复原本未...
由于癌症的突变模式各不相同,因此可是mafComapre参数比较两个不同队列的差异突变基因,检验方式为fisher检验。 #输入另一个 MAF 文件Our_maf <- read.csv("Our_maf.csv",header=TRUE)our_maf = read.maf(maf = Our_maf)#比较最少Mut个数为5的基因pt.vs.rt <- mafCompare(m1 = laml, m2 = our_maf...
laml_sampleSummary.txt 分析,可视化 1,绘制MAF文件的整体结果图 AI检测代码解析 plotmafSummary(maf = laml, rmOutlier = TRUE, addStat = 'median', dashboard = TRUE, titvRaw = FALSE) 1. 2,绘制oncoplot图 AI检测代码解析 #oncoplot for top 20 genes. ...
本文继续介绍maftools对于MAF文件的其他应用,为更易理解和重现,本次使用TCGA下载的LIHC数据。 一 数据部分 setwd("C:\\Users\\Maojie\\Desktop\\maftools-V2\\") library(maftools) laml.maf=read.csv("TCGA.LIHC.mutect.maf.csv",header=TRUE)
它其实是先下载了一个压缩包,成功之后再解压成为了文件夹给大家,解压后是每个样品一个独立的文件夹,文件夹里面才是具体的somatic的突变信息的maf文件: 每个样品一个独立的文件夹 但是如果换一个癌症,有时候就会出错,比如laml这个癌症,同样的代码 : library(TCGAbiolinks) ...