1)-num_alignments 2)-max_target_seqs 3)-num_descriptions 4)-max_hsps 这个4个命令有时容易搞混,在使用时每个都一次就可以区分,这里ChatGPT讲的还是比较详解。 3. 控制输出的格式(默认是-outfmt 6) 输出结果直接影响着我们如何看比对结果。 这里是一个blastn的输出结果一共12列,看一下每一列代表着什么?
大概意思是-max_target_seqs和-num_alignments是功能是一样的,只是针对不同的输出格式。当-outfmt小于等于4时使用-num_alignments,当-outfmt大于4时,使用-max_target_seqs。 感觉不太对,如果是这样的话NCBI根本就没有原因设置两个参数来完成这个目的。 2.3 测试 在当前目录下新建两个文件夹 -max_target_seqs、nu...
max_hsps_1_dict[bn.qseqid][bn.sseqid] = bnelse: max_hsps_1_dict[bn.qseqid] = {bn.sseqid: bn}# 第一步:检查normal.txt去重完成后是否只剩244行了normal_cnt =0forqseqidinnormal_dict: normal_cnt +=len(normal_dict[qseqid])print('去除query ID和subject ID完全相同的行后,%s还剩下%s...
[-sorthsps sort_hsps] [-max_target_seqs num_sequences] [-num_threads int_value] [-mt_mode int_value] [-remote] [-version] DESCRIPTION Nucleotide-Nucleotide BLAST 2.15.0+ OPTIONAL ARGUMENTS -h Print USAGE and DESCRIPTION; ignore all other parameters -help Print USAGE, DESCRIPTION and ...
ext.args = '--evalue 1e-5 --max-hsps 1 --max-target-seqs 200 -b 6 --outfmt 6' To investigate: It looks like DIAMOND can build the database with taxon info and limit to 1 hit per species, which is more ideal. e.g. build... (note this has been done and the taxon_mapped...