之前转录组数据分布规律的失败探索中的例子(GSE164425,统计Raw Count与CPM数据分布)可见bulk RNA-seq的原始定量数据并不符合正态分布。 因此直接使用t检验并不可取。目前大多数差异分析用的是limma、edgeR、DESeq2这三个包。 limma、edgeR、DESeq2包都建议使用Counts作为输入,也就是原始计数矩阵
TRUST3和TRUST4从模拟RNA-seq数据中报告的TRB CDR3数量 (c) 以BCR-seq结果为金标准,六个整体RNA-seq样本的精确度和召回率 (d) 通过对SMART-seq数据进行分组创建的伪整体RNA-seq数据上,评估TRUST4和MiXCR组装的全长V、CDR3和J序列。
通过结合bulk RNA数据,构建并验证了T细胞标记基因的预后风险模型。此外,使用CIBERSORT分析了TNBC的免疫浸润细胞,并研究了风险模型和对免疫疗法的反应之间的关联。 主要结果 1. TNBC中的细胞类型分析 GSE176078数据集的scRNA-seq数据在去除低质量细胞、标准化、整合和PCA之后,25932个细胞被分成14个簇(图1B),通过标记基...
所以GSEA分析比较适用于,传统分析方法筛选后样本过少的数据集。 GSEA数据库收集了很多分子标记数据,有9大分类的基因,如下: 九大分类如下: 实例解读 1. 数据读取 数据的读取我们仍然使用的是 TCGA-COAD 的数据集,表达数据的读取以及临床信息分组的获得我们上期已经提过,我们使用的是edgeR 软件包计算出来的差异表达结果...
Bulk2Space:基于深度学习网络将RNA-seq转化为单细胞分辨率的表达矩阵。 步骤: 1.参考矩阵构建:从RNA-seq数据中提取细胞类型特异性标记基因及其表达谱。 2.模型训练:优化权重矩阵以最小化spot表达谱与参考矩阵的拟合误差。 3.空间注释:生成细胞类型分布图(如免疫细胞在肿瘤中的空间聚集模式)。
【1】Bulk RNA-seq和scRNA-seq数据收集与预处理 文献解读 TCGA、GEO公共数据下载 差异表达基因分析 富集分析 【翰佰尔生物】, 视频播放量 2573、弹幕量 0、点赞数 99、投硬币枚数 53、收藏人数 372、转发人数 31, 视频作者 翰佰尔生物, 作者简介 官网:henbio.com/tools |
今天我们来学习Bulk RNA-seq数据(蛋白质组和单细胞转录组数据可适用)常用的一种数据可视化形式:gene ontology(GO)富集图!与上期的框架相似,本期主要分享以下3个方面: 一、GO富集图的常见呈现形式? 二、为什么要用GO富集图(使用GO富集图的常见目的)?
四、以DESeq2为例演示全过程 篇幅有限,本文仅演示基于DESeq2的差异分析全过程(基于counts进行分析,不能用tpm、fpkm等归一化后的数据,想获得练习数据,可在公众号输入:Bulk RNA-seq练习数据2)。 1.安装并加载R包(若有,则不用重新安装) install.packages('R.utils') ...
RNA-Seq数据分析分为很多种,比如说找差异表达基因或寻找新的可变剪切。如果找差异表达基因单纯只需要确定不同的read计数就行的话,我们可以用bowtie, bwa这类比对工具,或者是salmon这类align-free工具,并且后者的速度更快。 但是如果你需要找到新的isoform,或者RNA的可变剪切,看看外显子使用差异的话,你就需要TopHat...
在帮师妹处理bulk-RNAseq数据时,面临了大量fastq文件的下载与比对任务。数据由诺禾致源公司提供,并通过诺禾云交付平台分发。为解决数据传输问题,我们尝试了两种方法:第一种是下载到本地后再上传至服务器,这种方式虽然操作流程明确,但耗时较长;第二种则是利用lnd客户端直接下载至服务器,整体过程更...