Linux Shell输出文本中的指定行

2019-12-17

Linux Shell 输出文本中的指定行
在 Linux 系统上如何快速查看文本中指定行呢？有时文本较大比如有 10w 行，想要快速查看第 99 行该怎么做呢？
本文以文件名 test.txt 为例，介绍 3 种方式快速查看 test.txt 的第 99 行。相信你可以轻易的举一反三。

使用 sed
sed 全名：stream editor，流编辑器，使用程序的方式来编辑文本，可以实现替换、删除、新增、选取特定行等功能，是一种很 hacker 的方式。sed 基本上使用正则表达式匹配，对正则表达式要求较高。
想要快速入门 sed 参考 sed 简明教程，想要深入学习参考 sed 完整手册。

sed 语法格式：

1
2
3

sed [ -n ] [ -u ] Script  [ File ... ]
sed [ -n ] [ -u ] [ -e Script ] ... [ -f ScriptFile ] ...  [ File
... ]

关键 Options 介绍：

-n : 安静模式。一般sed用法中，所有来自STDIN的数据都会被输出到屏幕上，使用-n只有被sed处理的行才会列出来。如果不使用-n，使用sed打印时，会把输入流和处理的信息都打印一遍
a：append，追加文本
i：insert，插入文本
d：delete，删除文本
s: 模式匹配替换
p：打印文本
sed使用示例
在指定行插入或追加: a, i
a. 在test.txt第一行前插入：sed “1 i This is a test file” test.txt
b. 在test.txt最后一行追加：sed “$ a This is the end of file” test.txt
删除： d
a. 删除test.txt第二行： sed ‘2d’ test.txt
b. 删除test.txt符合正则表达式/fish的行： sed ‘/fish/d’ test.txt
修改文本：s
a. 将text.txt中love替换为like： sed “s/love/like/g” test.txt （/g表示全局匹配）
打印文本： p
a. 输出test.txt的第5-7行：sed -n ‘5,7p’ test.txt （-n的作用就显示出来了，可以去除-n查看效果）

ps: 以上命令并不会真的修改掉 test.txt 的内容，如果想修改文本内容可以使用重定向，或者使用-i 选项。

使用 sed 输出 test.txt 的第 99 行？
有了以上的 sed 基础，可以轻易得出解决方案：sed -n ‘99,p’ test.txt。但 sed 在 print 后并不会立即退出，还会继续搜索文件直到文件末尾，当文件较大的时候使用 sed 的效率会比较低。可以做如下优化：sed -n ‘99,p;100q’ test.txt，打印完之后在 100 行退出。

使用 awk
awk: 文本处理工具，可以在文件中查找与模式匹配的行并在这些行上执行指定的操作。awk 比 sed 早诞生 2-3 年，作用与 sed 类似。快速入门 awk 可参考 awk 简明教程。

awk 语法格式

1 2	awk [ -u ] [ -F Ere ] [ -v Assignment ] ... { -f ProgramFile \| 'Program' } [ [ File ... \| Assignment ... ] ] ...

awk 提供了一系列内建变量：

$0: 当前记录（这个变量中存放着整个行的内容）
$1~$n: 当前记录的第 n 个字段，字段间由 FS 分隔
FS: 输入字段分隔符默认是空格或 Tab
NF: 当前记录中的字段个数，就是有多少列
NR: 已经读出的记录数，就是行号，从 1 开始，如果有多个文件话，这个值也是不断累加中。
FNR: 当前记录数，与 NR 不同的是，这个值会是各个文件自己的行号
RS: 输入的记录分隔符，默认为换行符
OFS: 输出字段分隔符，默认也是空格
ORS: 输出的记录分隔符，默认为换行符
FILENAME: 当前输入文件的名字
awk 使用示例：
打印 test.txt 中第一列为 This 的行：awk ‘$1==”This” test.txt
打印表头和 test.txt 中第一列为 This 的行：awk ‘$1==”This” || NR == 1’ test.txt
格式化输出：awk ‘$1==”This” || NR==1 {printf “%-20s %-20s\n”,$4,$5}’ test.txt
使用 awk 输出 test.txt 的第 99 行？
使用内建变量 NR 和 FNR：

awk ‘NR==99’ test.txt
awk ‘FNR==99’ test.txt
ps: awk 打印完也不会立即退出，可以添加 exit 优化：awk ‘NR==99 {print; exit}’ test.txt

使用 head 和 tail 组合
head 和 tail 故名思意，相对简单，分别输出文件或流的开头 n 行或结尾 n 行，就不在此详细介绍了。直接给出解决方案：
tail -n+99 test.txt|head -1

很容易想到对称的组合：head -99 test.txt|tail -1，但是当文件不足 99 行时，输出的是文件最后一行的内容。