回到标题的问题,如果我想说只要和基因有overlap就是最近基因,这种情况其实你的最近基因就是host gene,也就是annotation这个column给出来的是相对应的,我们就想找peak所在位置的基因信息,那么这当然也是可以的,默认参数overlap=”TSS”, 如果改为overlap=”all”,它看的就是整个基因而不是TSS,当然distanceToTSS也还是...
考虑到不同基因如果距离较近,那么他们之间会存在有overlap,所以这里我们先提取出所有基因TSS上下游1kb范围的坐标,然后对其取并集: $ grep-v^# gencode.v40.annotation.gtf|awk-F"\t"-v OFS="\t"'{if($3~/gene/) {if($4-1000<0) print $1,0,$4+1000;else print $1,$4-1000,$4+1000}}'|bed...
首先,我们使用循环为每个样本中出现的非冗余峰生成一个逻辑向量。overlap <- list() for (i in 1:...
获取数据中重叠的peaks: overlaps<-ol$peaklist[["gr1///gr2"]]#提取overlap peaks 获取其注释信息: overlaps.anno<-annotatePeakInBatch(overlaps, AnnotationData = annoData, output ="nearestBiDirectionalPromoters", bindingRegion = c(-2000,500))#注释peak 对注释的信息进行entrez_id注释: library(org.Hs....
overlap=”TSS” 最近基因是相对于TSS overlap=”all” 最近基因是相对于整个基因 1.3.5.只想注释上游或者是下游的基因 只想注释上游:ignoreDownstream = T 只想注释下游:ignoreUpstream = T 注:默认都是FALSE 1.4.注释文件导出 as.data.frame就可以转成data.frame,然后就可以用write.table ...
1一个有关chip-seq的问题我想做测的2个chip-seq重复间的peak的相关性,用的是intersectBed -a a.bed -b b.bed -f 0.05 这样来找overlap的peak的个数,然后用 intersectBed -a a.bed -b b.bed -f 0.05 -v 来分别找sample1和sample2各自独有的peak数.再画维恩图看它们各自重叠的和非重叠的有多少, ...
面的代码是比较两个 peaks 文件的 overlap。然后还可以根据 R 很多 包都自带的数据来注释基因组特征: data(TSS.human.GRCh37) ## 主要是借 助于这个 GRanges 对象来做注释,也可以用 getAnnotation 来获取其它 GRanges 对象来 做注释 ## featureType : TSS, miRNA, Exon, 5'UTR, 3'UTR, transcript or Exo...
(int [=30]) --overlap_diff_limit the maximum number of mismatched bases to detect overlapped region of PE reads. This will affect overlap analysis based PE merge, adapter trimming and correction. 5 by default. (int [=5]) --overlap_diff_percent_limit the maximum percentage of mismatched ...
Toolkit旨在帮助用户轻松地从Cistrome DB的大量数据集中提取有效信息:1)输入基因名称, 查看有哪些转录因子可能调控该基因;2)输入基因组区域,查看有哪些转录因子可能结合在该区域;3)输入peak结果,查看哪些转录因子的结果与你的输入结果有明显的overlap,可以用于转录因子的colocation分析。 Toolkit功能 批量数据下载 在遵循Cis...
可以看到这个包使用起来非常简单,只需要把我们做好的peaks文件(GSM1278641_Xu_MUT_rep1_BAF155_MUT.peaks.bed等等)用toGRanges或者import读进去,成一个GRanges对象即可,上面的代码是比较两个peaks文件的overlap。然后还可以根据R很多包都自带的数据来注释基因组特征: ...