6.运行主程序HiC-Pro前修改config-hicpro.txt文件 将HiCPro安装目录下的config-hicpro.txt文件拷贝到脚本运行目录下,并进行修改。通常需修改的地方有以下几个,其中用前半部分参数非常重要,通常每次运行都要修改的。所有的参数官网有给出解释,地址链接为:http://nservant.github.io/HiC-Pro/MANUAL.html#manual 配...
这时我们就可以把它转化为.hic文件,放到juicebox中就很好的可视化。 juicer中的pre命令是用来做这个事情的。只要你的数据符合pre命令处理的格式,这个就很简单。具体用法:https://github.com/aidenlab/juicer/wiki/Pre 但有时我们的Hic-pro的结果文件不符合pre的格式,就需要使用hicpro2juicebox.sh这个脚本进行处理。
HiC-pro默认输出是sparse 矩阵的格式,首先需要一个bed文件定义chromosome的位置,以及bin的ID:在matirx中,显示interaction的强度,前两个分别是bin的ID。iced中存储normalization之后的结果。
出现该报错的原因: config文件中内存设置和线程数设置不一致(或不合理) 参照[bowtie_pairing] Error 1 · Issue #482 · nservant/HiC-Pro (github.com) yes well done ! So the samtools sort failed. If you look at your command, -@ 36 -m 21M, means that it only has 21Mo to sort the file...
使用HiC-Pro和EndHiC软件可以实现以下HIC热图绘制。 一.运行HiC-Pro 文件准备: 1.准备index文件 bowtie2-build genome.final.fa genome.final 2.准备annotation文件 要有两个: 第一个是bed文件,通过软件包里面HiC-Pro-3.1.0/bin/utils/digest_genome.py脚本生成。
复杂的是GENOME_FRAGMENT =,也就是 HiC消化片段位点文件,这个文件在每个HIC流程中都需要生成,一般HiC建库的酶为hindiii(A^AGCTT ) 或者dnpiii 生成命令为/PATH/HiC-Pro-master/bin/utils/digest_genome.py -r hindiii -o Refgenome.fasta 在软件例子里面是: ...
接下来用ICE校正(也是Hi-C Pro的标准校正方法), 这样每一行/每一列的全基因组接触概率之和等于1.0 Observed/expected contact的算法为 contact matrix 每个对角线除以其在非屏蔽基因组上的全染色体平均值而得到的。Compartment的计算参考了(Imakaev等,2012) ...
HiC-Pro实战详解 欢迎关注”生信修炼手册”! HiC-Pro软件非常灵活,不仅可以处理各种不同建库方式的Hi-C数据,也可以处理capture Hi-C数据。软件安装过程如下 yum install -y epel-release # R yum install -y R R install.packages(c("ggplot2", "RColorBrewer"))...
每个样本一个子文件夹,下面是对应的双端测序的fastq文件。输出结果目录如下 代码语言:javascript 复制 |--bowtie_results|--config_test_latest.txt|--hic_results|--logs|--rawdata->/HiC-Pro-2.11.1/test_data/`--tmp 其中hic_results目录下是最终结果,包含了不同分辨率下的hi-c图谱和质控的图表。
HiC数据标准化工具pipeline。流程主要分为6个步骤,比对、过滤HiC比对结果、检测有效HiC序列、结果合并、构建HiC关联图谱以及关联图谱标准化。此外HiC-Pro还可以进行HICUP、HiCdat等众多HiC数据处理软件所不能进行的等位基因特异性HiC分析。其中bwt2文件夹下有一些数据统计