CSVTK,即CSV工具包,是一个用于处理逗号分隔值(CSV)文件的实用命令行程序。由于其简单性、灵活性和效率,对于经常处理CSV文件的人来说,特别是在数据科学、生物信息学以及任何需要数据分析的领域,CSVTK都是一种非常有价值的工具。
CSVTK的最大优点之一是其跨平台兼容性,这意味着你可以在各种操作系统中使用它,包括Windows、macOS和Linux。
该程序也是高效和实用的,提供了许多命令,可以帮助你轻松处理CSV文件。以下是一些常用的CSVTK命令及其使用方法:
美化打印CSV/TSV:以表格形式对齐显示CSV/TSV数据。
csvtk pretty -t input.tsv
过滤:通过评估布尔表达式来过滤行。
csvtk filter -t -f '$1 > 0 && $3 == "abc"' input.tsv
选择:从CSV/TSV数据中选择特定字段/列。
csvtk cut -t -f column1,column2 input.tsv
排序:按特定字段/列对CSV/TSV数据进行排序。
csvtk sort -t -k column1:nr input.tsv
查看规格:查看当前表格的行列数。
csvtk -t stat input.tsv
尤其第一个美化查看可以说是非常实用,不过大文件需管道后接less,效果如下
用完之后再也不想只使用less了,因此声明了一个alias,将以下代码写入~/.bashrc
alias ee='function ctpe_func() { csvtk -t pretty "$1" | less -SN; }; ctpe_func'
后续只需要
ee input.tsv
本文只说了该软件功能的冰山一角,完整的可见帮助或官网:https://github.com/shenwei356/csvtk
或见中文描述网站:https://bioinf.shenwei.me/csvtk/chinese/
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!