Type-II问题是由于在反卷积中使用未匹配基因长度标准化的scRNA-seq和bulk RNA-seq data作为输入引起的。许多人可能没有注意到,由于scRNA-seq和 (total) bulk RNA-seq的协议差异,在原始计数下,scRNA-seq data中的基因表达与基因长度无关,而在bulk RNA-seq data中与基因长度有关。因此,如果使用原始计数的scRNA-se...
研究发现,应用 CP10K 归一化的 scRNA-seq 数据作为批量 RNA-seq 反卷积的参考时,会产生缩放效应(Type-I 问题),影响细胞反卷积结果,尤其对肿瘤微环境中的稀有细胞类型影响显著;批量 RNA-seq 样本文库制备过程中的基因长度效应(Type-II 问题)以及参考样本和混合样本中相同细胞类型基因表达差异被忽视(Type-III 问题)...
quanTIseq将从肿瘤样本或其他细胞混合物中读取的RNA-seq作为输入FASTQ文件,并通过反卷积量化十种不同免疫细胞类型的比例和异质样本中其他未特征细胞的比例(表1)。quanTIseq分析包括三个步骤(图1): 使用Trimmomatic 预处理原始 RNA-seq 数据(单端或双端),以删除 Illumina 接头序列,trim 低质量的 reads,将长读取裁剪到...
近期,科研人员开发了基于深度学习的反卷积方法,但这些方法往往需要对相同组织类型的单细胞RNA-seq数据或配对流式细胞仪数据进行再训练,这限制了其临床应用。 近日,美国MD安德森癌症中心和BostonGene公司的研究团队合作在Cancer Cell上发表了...
图5. 微环境反卷积的验证和Kassandra在免疫治疗反应预测中的适用性。 综上所述,研究团队开发了基于决策树ML的Kassandra算法,使用批量RNA-seq重建肿瘤活检和血液中的细胞组成,并收集了一个包含不同细胞群9,400多个分类样本的RNA-seq数据库,用于创建人工转录组以训练、开发Kassandra。基于其独特的RNA特征,Kassandra算法可...
在这里,香港中文大学的研究人员介绍了 Tissue-AdaPtive autoEncoder(TAPE),这是一种连接批量 RNA-seq 和单细胞 RNA-seq 的深度学习方法,可在短时间内实现精确的反卷积。通过构建可解释的解码器并在独特的方案下进行训练,TAPE 可以自适应地预测细胞类型分数和细胞类型特异性基因表达组织。与几个数据集上的流行...
#导入bulkRNA数据 load("Data.Rdata") 2、数据预处理 Bulk RNA-seq 数据从表达矩阵(列是样本,行是基因)转换为 ExpressionSe 这里就跟贝叶斯反卷积的数据格式不一样了~ bulk.matrix <- 2^exprSet-1 # 逆转回TPM数据 bulk.eset <- Biobase::ExpressionSet(assayData = bulk.matrix) ...
该研究整合了Bulk RNA-seq和单细胞RNA-seq数据,系统探索了UTI在脓毒症中的潜在机制。结果显示,UTI通过是调节中性粒细胞活性来介导免疫调节作用。UTI对改善器官功能障碍的严重程度起着有益的作用。进一步的分析发现,与中性粒细胞具有形...
使用单细胞数据作为反卷积的基准。 免疫细胞的微环境特异性基因表达谱以及给定样品的真实表达图谱可通过scRNA-seq获得,并可作为基准反卷积方法的基础。我们研究了bulk基因表达数据(例如黑色素瘤样品)的去卷积结果如何受微环境特定变化和患者之间差异的影响。作为反卷积的基准,我们通过对27个样本中的每个样本的所有单细胞...
在原文"Profiling tumor infiltrating immune cells with CIBERSORT "中提到了对于数据的要求 (1)表达量矩阵不能有负值,不能有缺失值 ,不要log转化 ; (2)RNA-Seq表达量的话,FPKM和TPM都可以; 2,数据转化 CIBERSORT需要2个输入文件,一个是表达矩阵文件,一个是前面提到的LM22.txt(22种免疫细胞的基因表达特征数据...