质量控制(过滤低质量细胞,去除线粒体基因含量高的细胞);PCA降维与t-SNE聚类;细胞亚群注释(基于已发表的marker基因)。3. 评估指标 本研究采用以下指标衡量去卷积方法的性能:均方根误差(RMSE):衡量预测值与真实值之间的误差,数值越低越好;皮尔逊相关系数(PCC):衡量预测结果与真实细胞比例的相关性,数值...
线粒体reads与细胞降解有关,并且有证据表明核糖体基因可以影响聚类,在分析中隐藏其他生物学结构。作者发现核糖体基因的去除强烈地降低了聚类的质量,表明它们代表了亚群之间的真正生物学差异。删除线粒体基因并且只用蛋白质编码基因对聚类的影响非常小。 (4)Normalization and scaling 作者调查不同标准化策略的影响。除了S...
1、从获取原始数据,中间经历过滤、比对,到featureCounts统计基因上的reads数,这些都需要在服务器上操作,是传统意义上的上游流程(如果用解剖学的命名习惯,我给它取个名字叫“固有上游分析upstream analysis proper”)。 2、从reads数统计的结果,经过表达矩阵构建、基因ID转换、去冗余ID、表达量单位转换,最终拿到可靠的表...
作者在使用大量人类RNA-seq样本在两个条件之间寻找差异表达基因时,通过置换(permutation)分析发现热门的生信软件DESeq2和edgeR的假阳性率高得出乎意料。此外作者还测试了limma-voom、NOISeq、dearseq和Wilcoxon秩和检验,发现除了Wilcoxon秩和检验以外的方法常常无法控制假阳性率。尤其DESeq2和edgeR,当目标FDR为5%时,实际上...
线粒体reads与细胞降解有关,并且有证据表明核糖体基因可以影响聚类,在分析中隐藏其他生物学结构。作者发现核糖体基因的去除强烈地降低了聚类的质量,表明它们代表了亚群之间的真正生物学差异。删除线粒体基因并且只用蛋白质编码基因对聚类的影响非常小。 (4)Normalization and scaling ...
RNA-seq数据的生物信息学分析 转录本组装流程 转录本组装流程 ▪数据预处理 1.数据质量评估:对RNA-seq测序数据进行质量评估,如FastQC工具,检测并去除低质量的reads。2.对接偏好性校正:消除接头污染和不对称对接等问题,提高转录本组装准确性。3.线粒体序列过滤:去除线粒体基因组污染,专注于细胞核编码转录本的...
单细胞RNA测序(scRNA-seq)技术促使人们有机会剖析肺腺癌(LUAD)和肺鳞状细胞癌(LUSC)之间的独特免疫特征,这是NSCLC的两种主要亚型。在这里,我们对40个肿瘤样本中的72,475个免疫细胞进行了scRNA-seq,并匹配了19名非SCLC患者的相邻正常组织,并绘制了...
线粒体基因表达量比例过高的细胞被去除 自噬凋亡的细胞,通常会出现线粒体基因的超表达。因此,利用这一指标,可以去除此类细胞。 细胞聚类分群 1 亚群分类的方法 细胞亚群分类是10X ScRNA-seq数据分析的核心步骤,不同软件有不同的算法。因为10X ScRNA-seq数据量大,数据结构复杂,对应的分群算法也比较复杂,我们这里就不...
其中filter_by_MT是指线粒体基因,应当去除其中线粒体基因表达异常的cell gene 筛选 我们保留某个基因至少在2个cell中都检测到且有1个count以上的基因 filter_genes<-apply(counts(umi[,colData(umi)$use]),1,function(x)length(x[x>1])>=2)rowData(umi)$use<-filter_genestable(filter_genes) ...