可以看到每列为一个样本,每行为一个基因的ensmble。 目前肠矩阵中前20个样本为正常样本,后20个样本为肿瘤组织样本,后续我们根据样本的性质建立分组信息表 血的标本有多个...
1 找到原始分组信息 下载SraRunTable.txt文件,里面有分组信息(这一步应该放在开始就更名完成),内容见下 Assay_Type Library_Name Run RNA-Seq Lib_FUSCCTNBC001 SRR8518252 WXS Lib_FUSCCTNBC001.TT_WES SRR8517928 WXS Lib_FUSCCTNBC002.TT_WES SRR8517929 RNA-Seq Lib_FUSCCTNBC003 SRR8518401 RNA-Seq Lib_F...
panel=${arr[0]} #该行第一列赋值给panel id=${arr[1]} #该行第二列赋值给id #grep从输入文件中遍历逐行提取包含字符Ensembl_ID和$id的行,并导出到输出文件中 grep -E "Ensembl_ID|$id" "/mnt/vol2_ws/test/projects/xcy/data/2021-8-12-liang/data/11/tcga/TCGA-KIRP/TCGA-KIRP.htseq_fpkm4...
RNASeq1:对得到的count进行差异基因分析 RNASeq2:对得到的count进行fpkm值计算 四、Python- pandas 和 numpy 的下载与安装 - 简书https://www.jianshu.com/p/8de14da3f7f4 五、Python对按fpkm分组后的基因bed文件匹配 import pandas as pd #小文件 encoding="gbk" 保证含有中文字符时不乱码 high = pd.read...
3 针对top100的sd的基因集的表达矩阵 进行重新 聚类并且分组。 n=t(scale(t(dat[cg,]))) n[n>2]=2 n[n< -2]= -2 n[1:4,1:4] ##这个聚类分组只是对top100的sd的基因集 hc=hclust(dist(t(n))) clus = cutree(hc, 4) group_list=as.factor(clus) table(group_list) ##这个聚类分组信...