Linux Shell 输出文本中的指定行
在 Linux 系统上如何快速查看文本中指定行呢?有时文本较大比如有 10w 行,想要快速查看第 99 行该怎么做呢?
本文以文件名 test.txt 为例,介绍 3 种方式快速查看 test.txt 的第 99 行。相信你可以轻易的举一反三。
使用 sed
sed 全名:stream editor,流编辑器,使用程序的方式来编辑文本,可以实现替换、删除、新增、选取特定行等功能,是一种很 hacker 的方式。sed 基本上使用正则表达式匹配,对正则表达式要求较高。
想要快速入门 sed 参考 sed 简明教程,想要深入学习参考 sed 完整手册。
sed 语法格式:
1 | sed [ -n ] [ -u ] Script [ File ... ] |
关键 Options 介绍:
1 | -n : 安静模式。一般sed用法中,所有来自STDIN的数据都会被输出到屏幕上,使用-n只有被sed处理的行才会列出来。如果不使用-n,使用sed打印时,会把输入流和处理的信息都打印一遍 |
ps: 以上命令并不会真的修改掉 test.txt 的内容,如果想修改文本内容可以使用重定向,或者使用-i 选项。
使用 sed 输出 test.txt 的第 99 行?
有了以上的 sed 基础,可以轻易得出解决方案:sed -n ‘99,p’ test.txt。但 sed 在 print 后并不会立即退出,还会继续搜索文件直到文件末尾,当文件较大的时候使用 sed 的效率会比较低。可以做如下优化:sed -n ‘99,p;100q’ test.txt,打印完之后在 100 行退出。
使用 awk
awk: 文本处理工具,可以在文件中查找与模式匹配的行并在这些行上执行指定的操作。awk 比 sed 早诞生 2-3 年,作用与 sed 类似。快速入门 awk 可参考 awk 简明教程。
awk 语法格式
1 | awk [ -u ] [ -F Ere ] [ -v Assignment ] ... { -f ProgramFile | |
awk 提供了一系列内建变量:
$0: 当前记录(这个变量中存放着整个行的内容)
$1~$n: 当前记录的第 n 个字段,字段间由 FS 分隔
FS: 输入字段分隔符 默认是空格或 Tab
NF: 当前记录中的字段个数,就是有多少列
NR: 已经读出的记录数,就是行号,从 1 开始,如果有多个文件话,这个值也是不断累加中。
FNR: 当前记录数,与 NR 不同的是,这个值会是各个文件自己的行号
RS: 输入的记录分隔符, 默认为换行符
OFS: 输出字段分隔符, 默认也是空格
ORS: 输出的记录分隔符,默认为换行符
FILENAME: 当前输入文件的名字
awk 使用示例:
打印 test.txt 中第一列为 This 的行:awk ‘$1==”This” test.txt
打印表头和 test.txt 中第一列为 This 的行:awk ‘$1==”This” || NR == 1’ test.txt
格式化输出:awk ‘$1==”This” || NR==1 {printf “%-20s %-20s\n”,$4,$5}’ test.txt
使用 awk 输出 test.txt 的第 99 行?
使用内建变量 NR 和 FNR:
awk ‘NR==99’ test.txt
awk ‘FNR==99’ test.txt
ps: awk 打印完也不会立即退出,可以添加 exit 优化:awk ‘NR==99 {print; exit}’ test.txt
使用 head 和 tail 组合
head 和 tail 故名思意,相对简单,分别输出文件或流的开头 n 行或结尾 n 行,就不在此详细介绍了。直接给出解决方案:
tail -n+99 test.txt|head -1
很容易想到对称的组合:head -99 test.txt|tail -1,但是当文件不足 99 行时,输出的是文件最后一行的内容。