# 第二步:检查max-hsps-1.txt读入字典是不是也是有244行 # 如果是244行的话说明,max-hsps-1.txt中没有qseqid、sseqid完全相同的两行 max_hsps_1_cnt = 0 for qseqid in max_hsps_1_dict: max_hsps_1_cnt += len(max_hsps_1_dict[qseqid]) print('读入%s后,还剩%s行。' % (max_hsps_1_...
在当前目录下新建两个文件夹 -max_target_seqs、num_alignments,为了比较这两个参数的不同,我们分别把-max_target_seqs和-num_alignments从1到500,分别运行500次,比较这500个结果之间的异同。 2.3.1-max_target_seqs $ for i in `seq 1 500`; do blastn -query otu.fa -outfmt '6 qseqid sseqid qst...
1)-num_alignments 2)-max_target_seqs 3)-num_descriptions 4)-max_hsps 这个4个命令有时容易搞混,在使用时每个都一次就可以区分,这里ChatGPT讲的还是比较详解。 3. 控制输出的格式(默认是-outfmt 6) 输出结果直接影响着我们如何看比对结果。 这里是一个blastn的输出结果一共12列,看一下每一列代表着什么?
[-max_hsps int_value] [-xdrop_ungap float_value] [-xdrop_gap float_value] [-xdrop_gap_final float_value] [-searchsp int_value] [-penalty penalty] [-reward reward] [-no_greedy] [-min_raw_gapped_score int_value] [-template_type type] [-template_length int_value] [-dust DUST_...
It is possible for what should be a single HSP to look like multiple HSPs if the extension terminates (low sequence quality and hard-masking cause this). True splicing events are easily identified from their coordinates; there ought to be a large coordinate gap in the genome but not the ...
BLASTN参数研究记之max_hsps 最近频繁使用到BLASTN,BLASTN有很多参数。有一些显而易见的参数,例如: -query -out -outfmt -db 也有一些参数不那么常用,今天主要研究研究这些不常用的参数。 1. 准备数据 主要用的数据有: BLASTN索引文件 Query序列 假定这些文件都放置在当前文件夹,并且当前文件夹有一个ret的子文...