# 选择第3列门是Actinobacteria 的行 csvtk -t grep -f 3 -p Actinobacteria taxonomy.txt # 可用列表 -P 接匹配列表 # 构建一个id列表,并去除表头 csvtk -t cut -f 1 otutab.txt | head | csvtk del-header > id.txt # 使用-P选项后面接列表,比awk筛选更方便 csvtk -t grep -f 1 -P id.txt...
csvtk 特点 熟悉Linux的人谈到命令行的文本处理,定会奉上文本处理「三剑客」:awk,sed,grep。csvtk 并不想抢他们的风头,而是可以无痛的整合到各种处理流程中。它凭借自己的特点,让命令行里的文本处理更容易。 csvtk 的特点之一是对 header 的识别和处理,它可以让你省去很多原本在使用 awk 等命令时针对 header 行...
csv | csvtk grep -f id -p 1 -r | csvtk pretty #7 分组计算 cat digitals2.csv | csvtk summary -i -g f1,f2 -f f4:sum,f5:sum | csvtk pretty #8 合并文件 cat names.csv cat phones.csv csvtk join -f 'username;username' --keep-unmatched names.csv phones.csv csvtk join -f '...
By exactly matching:csvtk grep -f first_name -p Robert -p Rob By regular expression:csvtk grep -f first_name -r -p Rob By pattern list:csvtk grep -f first_name -P name_list.txt Remore rows containing missing data (NA):csvtk grep -F -f "*" -r -p "^$" -v ...
grep指定(多)列为Key进行搜索(最常用命令之一,可按指定列搜索) filter按指定(多)列的数值进行过滤 filter2用类似awk的数值/表达式,按指定(多)列的数值进行滤 join合并多个文件(常用) 编辑 rename直接重命名指定(多)列名(简单而实用) rename2以正则表达式重命名指定(多)列名(简单而实用) ...
grep 指定(多)列为Key进行搜索(最常用命令之一,可按指定列搜索) filter 按指定(多)列的数值进行过滤 filter2 用类似awk的数值/表达式,按指定(多)列的数值进行过滤 join 合并多个文件(常用) # 编辑 rename 直接重命名指定(多)列名 rename2 以正则表达式重命名指定(多)列名 ...
我们利用各种生信工具(bedtools/vcftools/samtools)、grep/awk/sed,或者是自己写程序对其进行处理来实现自己的目的,而在这过程中速度和效率就是个很重要的因素。有时候自己在处理文件时花时间去写的一些脚本,用完就扔。偶然了解到csvtk这个工具,发现其实以前写的许多脚本在这个工具中一行命令就能解决,是个效率提升的好...
grep类似于 lunix 的 grep,支持正则和反选等操作+ filter按照数学表达式筛选,支持多列判断,精简版 filter2按照数学表达式筛选,约等于 lunix 中的 awk,复杂版+ join按照字段合并多个文件,类似于 linux 的 join split按照某列值拆分文件,也就是分组保存为多个文件 ...
csvtk是shen wei的作品,seqkit也是他写的。 csvtk githubs 安装conda install -c bioconda csvtk或者从https://github.com/shenwei356/csvtk/releases下载二进制文件。 支持Linux,mac,windows. 相当于shell的sed,grep,awk,cut,uniq,sort,join的合集。优点是支持多线程,支持读写gz压缩文件。
grep 指定(多)列为Key进行搜索(最常用命令之一,可按指定列搜索) filter 按指定(多)列的数值进行过滤 filter2 用类似awk的数值/表达式,按指定(多)列的数值进行过滤 join 合并多个文件(常用) # 编辑 rename 直接重命名指定(多)列名 rename2 以正则表达式重命名指定(多)列名 ...