fq2fa translate fastq file to fasta fqstat summary statistics of fastq file mergeVcf merge vcf filesfromlist statVcf summary statistics of vcf file makewind make bedfroma list file 统计fastq文件信息: 输出read的平均长度,GC含量,总read数量和总的碱基数量,当然还包括ATGC和N碱基的数量和百分比,最后就...
主要是fq转fa、合并多个染色体的vcf文件等,功能不多(主要是C写起来太操蛋了T_T),通常我也只用来统计fastq文件信息: usage: Program: skr Usage: skr [options] fq2fa translate fastq file to fasta fqstat summary statistics of fastq file mergeVcf merge vcf files from list statVcf summary statist...
Basic_Statistics_of_Sequencing_Quality.txt 包含质控数据。Q20,Q30等信息。 Statistics_of_Filtered_Reads.txt Statistics_of_Filtered_Reads.txt Fastp=== GitHub 地址:OpenGene/fastp --比较有特色的地方: 自动检测adapter并trimming,不必要输入额外的参数。 对于SE数据,通过分析前1M个reads 的 tails 自动检测adapter...
绿色表示“通过”,红色表示“未通过”,黄色表示“警告(不太好)” Basic Statistics,基本的数据统计包括文件名,文件类型,编码形式,总的序列数,质量差的序列,序列平均长度,GC含量。 Per base sequence quality,各位置碱基质量,每个read各位置碱基的测序质量。 横轴碱基的位置,纵轴是质量分数,Quality score=-10log10p(...
Using awk: cat input.fq | awk '{if(NR%4==2) print length($1)}' > input.readslength.txt if zipped file, using: zcat input.fq.gz | awk '{if(NR%4==2) print length($1)}' >input.readslength.txt get length statistics:
Statistics on filtered FASTQ files using Fastx toolkit.Ratan, ChopraGloria, BurowAndrew, FarmerJoann, MudgeCharles, E. SimpsonMark, D. Burow
A single fast and exhaustive tool for summary statistics and simultaneous *fa* (fasta, fastq, gfa [.gz]) genome assembly file manipulation. - vgl-hub/gfastats
Statistics - scans a FASTQ file, and produces some statistics about the quality and the sequences in the file. FASTQ-Quality-BoxPlot, and FASTQ-Nucleotides-Distribution - Generates charts based on the statistics generated by FASTQ-Statistics. These charts can be used to quickly see the quality ...
(1)General Statistics:所有样本数据基本情况统计 %Dups——重复reads的比例 %GC——GC含量占总碱基的比例,比例越小越好 Length——测序长度 M Seqs——总测序量(单位:millions) (2)Sequence Quality Histograms:每个read各位置碱基的平均测序质量 横坐标——碱基的位置 ...
⑴BasicStatistics 包括测序技术/平台、reads数量、长度、GC含量等。 ⑵Per base sequence quality 所有reads碱基的测序质量统计结果。箱线图中红色线表示中位数,黄色是25%-75%区间,延伸线是10%-90%区间,蓝线是平均数曲线。若任一位置碱基的下四分位数低于10或中位数低于25,报"WARN";若任一位置的下四分位数...