Linux 零基础入门 DAY12

day12三、文本查看、操作、统计命令1、文本查看的五个命令

命令 常见参数 常见用法
cat ①-A:显示所有内容,包括特殊字符;②-n:显示所有行号,-b 显示非空行行号 ①向文件写入内容:$ cat > file(>为重定向符),输入内容后按Ctrl+C结束,再使用cat file查看;②zcat可用于查看压缩文本文件。
head / tail -n:指定显示前/后n行,默认10行 $ cat Data/example.gtf
more 参数 文件名 分页查看文件内容,空格翻页,回车换行,q退出
less ①-N:显示行号;②-S:单行显示;③zless:查看压缩文件;④/keyword搜索关键词;⑤n/N浏览关键词;⑥g/G快速回到开头/结尾。 支持更多功能的分页查看器,more更简单,less为其增强版,可独立显示内容,也可通过管道传递给head输出。

2、文本操作和统计命令

命令 常见参数 常见用法
wc ①-l:统计行数;②-w:统计单词数(含空格);③-c:统计字节数 可同时处理多个文件进行统计,常用于计算行数。
cut ①-d:指定分隔符,默认为\t;②-f:选择要输出的列 ①不仅支持符号作为分隔符,也可以使用字母或数字等字符,如cut -d 'h'将以h作为分隔符。
sort ①-n:按数值排序;②-V:识别字符串中的数值排序;③-r:逆序排列;④-k:按指定列排序;⑤-t:指定分隔符 示例:cat Data/example.gtf
uniq -c:统计连续重复行的数量 uniq只能删除相邻重复行,因此通常需要配合sort使用。
paste -d:指定合并分隔符;-s:按行合并 ①纵向合并用cat,横向合并用paste;②paste file1 file2;③seq 20
tr -d:删除特定字符;-s:压缩连续重复字符 tr ‘’ ‘’用于替换字符,前者被后者替换。
md5sum -c:校验MD5值 ①生成MD5:md5sum;②保存:md5sum Data/reads.1.fq.gz > reads.1.fq.gz.md5;③验证:md5sum -c reads.1.fq.gz.md5

补充说明:column -t可以让表格对齐更好看;制表符为\t(cat显示为^I);换行符为\n(cat显示为$);MD5主要用于验证数据完整性,确保完全一致。

3、练习题

练习1
练习2
练习3
练习4
练习5
练习6
练习7
练习7