这种分析尤其困难,因为scATAC-seq数据集的注释工作较为复杂,这不仅因为单细胞水平上收集的基因组数据较为稀疏,也因为scRNA-seq数据中缺少易于解释的基因标记。 在2019年由Stuart*, Butler*等人的研究中,引入了一种方法,用以整合来自同一生物体系的scRNA-seq和scATAC-seq数据集,并在本文[1]中展示了这些方法的应用。
在scATAC-seq数据中,对于每一个细胞,我们通过基因及基因上游2kb内的peak丰度去量化每个基因在每个细胞中基因开放性,即在这个区域内,peak丰度越高,基因就越有可能受到转录因子调控或与RNA聚合酶结合,基因开放性越高。对于每一个样本,我们计算平均基因开放性(scATAC-seq)和平均基因表达量(scRNA-seq),并进行相关性分析...
为了说明如何利用单细胞染色质的基准数据集和查询数据集来实现这一点,PBMC多组学数据集被用作基准,借助Seurat软件包中的FindTransferAnchors()和MapQuery()函数,将scATAC-seq数据集映射到基准数据集。使用MapQuery()函数后,成功地将单细胞ATAC测序数据集与多模态基准数据集进行了映射,并传递了细胞类型标签。在进行...
这种分析尤其困难,因为scATAC-seq数据集的注释工作较为复杂,这不仅因为单细胞水平上收集的基因组数据较为稀疏,也因为scRNA-seq数据中缺少易于解释的基因标记。 在2019年由Stuart, Butler等人的研究中,引入了一种方法,用以整合来自同一生物体系的scRNA-seq和scATAC-seq数据集,并在本文中展示了这些方法的应用。 分析要点...
识别scRNA-seq 和 scATAC-seq 数据集之间的anchors 为了在单细胞RNA测序(scRNA-seq)和单细胞ATAC测序(scATAC-seq)实验之间找到相互关联的“锚点”,首先利用Signac软件包中的GeneActivity()函数,通过计算2kb启动子区域和基因体内的ATAC-seq测序计数,来估算每个基因的转录活性。
执行了 MapQuery() 函数后,成功地将单细胞ATAC测序(scATAC-seq)数据集与多模态基准数据集进行了映射,并且实现了从基准数据集到查询数据集的细胞类型标签传递。现在,可以将这些映射结果进行可视化,并查看与 scATAC-seq 数据集现在关联的细胞类型标签: p1<-DimPlot(pbmc.multi,reduction="umap",group.by="predicted....
scATAC-seq分析的第一个关键步骤就是识别染色质开放区域,即Peak Calling,这个步骤的数据好坏直接决定的后续所有的数据分析结果,并且还由于不同细胞的peak分布不同或者稀有细胞开放区域检测信号较低的影响,使得scATAC-seq以样本进行peak检测时会丢失一些peak信息,最终影响后续数据的挖掘。10X官方配套的Cell Ranger ATAC工具...
SANGO应用到大脑组织:研究人员将SANGO应用到一个大脑组织数据集上,并对数据集进行了细胞类型注释。基于注释的细胞类型,SANGO别了细胞特异的peak。基于特异Peak,研究人员进行了motif 富集分析,发现每个细胞类型显示了特异的motif。组织特异性表达...
下载数据 首先不同于传统的NGS测序数据,如果你直接下载_1.fastq.gz和_2.fastq.gz由于缺少barcode文件,cellranger ATAC是无法运行的,所以只能使用SRA Toolkit将原始sra文件下载下来,然后再分解为单独的文件。 好!重点来了!既然要分解那就要选择块一点的方式,传统的fastq-dump我是不敢再用了,巨慢。因此有没有替代品...
单细胞染色质可及性测序(scATAC-seq)数据分析教程:Signac和Seurat高度集成、无缝连接,助力scATAC-seq数据高效处理, 视频播放量 3995、弹幕量 2、点赞数 104、投硬币枚数 89、收藏人数 218、转发人数 27, 视频作者 scverse, 作者简介 生物信息学博士,公众号:生信编程自