数据分析流程 依赖安装 模型准备 数据插补与模型训练 细胞聚类结果可视化 结果展示 scHi-C数据增强结果可视化 参考文献 引言 近年来单细胞Hi-C数据成为了三维基因组学的研究热点,单细胞Hi-C数据可以用于研究单个细胞中的染色质结构,从而可以针对特定类型的细胞分别测量其转录调控元件间的空间相互作用。相较于传统Hi-C,...
Hi-C技术使用的是二代测序(与之一争长短的是结合三代测序的染色质构像捕获技术Pore-C,详情请戳:T2T 基因组2.0 — 基因组组装到达终点了吗?),原始测序数据(raw data)中包含了低质量序列和接头序列,为了保证分析结果的可靠性,我们可以使用fastp等软件对Hi-C原始测序数据进行过滤,得到FASTQ格式的clean data后进行后...
-c: config文件路径 -o: 结果生成路径 -i: 原始数据路径 -p: 集群运行 5.结果解读 总目录 bowtie_results:比对结果目录 hic_results:hic矩阵及分析结果目录 logs:存放分析日志 rawdata:链接了原始数据 tmp:存放中间文件 Bowtie_result目录 bwt2:存放合并后的bam文件和统计结果 bwt2_global:存放全局比对结果 b...
通过染色体相互作用热图比较,肉眼是很难寻找二者的差异,或者说观察到的差异不明显,本文采取“减法”算法,巧妙地将两个细胞系的互作热图整合到一张图中,结果发现在小染色体中(16-22号染色体),MCF-10A细胞系中有较强的基因相互作用。 图3 MCF-10A和MCF-7中16-22号染色体间相互作用比较 A/B compartment 差异分析 ...
Hi-C 分析中的文件格式 首先Hi-C 以及相关的变种都是基于二代测序的实验, 下机的数据和其他二代数据没有差别,都是 fastq 格式存储的 reads。 然后经过一些预处理和比对生成用来表示比对结果的 bam 文件。 到这一步为止所有软件的数据格式基本上都是一样的,没有问题。
Hi-C标准文库是标准的Chimera结构,在将两端序列进行比对到基因组上时,理论上两侧pair ends可以分别比对到基因组的两个座位。由于DNA在碎片化过程中,剪切是随机的,因此酶切位点末端补平形成的junction fragment很可能分布在一侧的reads中,常规的比对分析是很难处理chimera的。在HiC-Pro和HiCUP软件中,...
部分分析结果展示 变异信息全局总览图 TAD总览图 两样本差异矩阵全局互作热图 样本间差异A/B Compartment分析图 样本间差异TAD分析图 以上是基于三代人重、Hi-C、转录组测序的医学三组学研究方案,除了以上组学的联合分析,安诺三代医学多组学方案,还支持包含全基因组甲基化、ChIP-seq、蛋白质组在内的整体多组学私人定...
上图里,A图是分别用不同量的3C和Hi-C文库跑的胶。一般来说Hi-C文库的连接效率要比3C稍微低一些,所以会有一些弥散的感觉。质量控制步骤应显示3C和Hi-C库均大于10 kb。DNA条带弥散表明连接效率差。B图里分别是不同的对照和进行两次酶切的DNA胶结果图。NheI切割了70%的Hi-C扩增子。
在三维基因组的研究当中,基因组折叠形成的拓扑结构域(topologically-associating domains ,TADs),在很多生物学过程如细胞分化、转录调控、基因组复制及DNA修复中有着重要的作用。Hi-C 能够帮助我们找到在三维空间内距离相近,有相互作用的DNA区域,通过合适的算法我们
并执行相应的命令(如plot、tads或subset)。分析结果通常包括交互图、计算的TADs指数及热图,直观展示了每个窗口的TADs信息。此外,工具还支持保存结果,方便后续研究。tadtool中的算法选择、参数设置和结果保存功能,为Hi-C数据的分析提供了强大支持,有助于研究人员更深入地理解基因组的三维结构和功能。