3.17 统计文件的行数、单词数和字符数

在文本处理工作中,统计文件的行数、单词数和字符数非常有用。很多时候,单词或字符计数被作为一种间接的技巧来生成所需要的输出样式及结果。本书在其他章节就包含了一些这样的实例。对开发人员来说,统计LOC(Line of Code,代码行数)是一件重要的工作。我们可能需要对除无关文件之外的特定类型的文件进行统计。将wc结合其他一些命令会有助于我们实现这些需求。

3.17.1 预备知识

wc是一个用于统计的工具。它是Word Count(单词统计)的缩写。让我们来看看如何使用wc统计文件的行数、单词数和字符数。

3.17.2 实战演练

统计行数:

  1. $ wc -l file

如果需要将stdin作为输入,使用下列命令:

  1. $ cat file | wc -l

统计单词数:

  1. $ wc -w file
  2. $ cat file | wc -w

统计字符数:

  1. $ wc -c file
  2. $ cat file | wc -c

举个例子,我们可以按照下面的方法统计文本中的字符数:

  1. echo -n 1234 | wc -c
  2. 4

-n用于避免echo添加额外的换行符。

当不使用任何选项执行wc时:

  1. $ wc file

它会打印出文件的行数、单词数和字符数,彼此之间用制表符分隔。

3.17.3 补充知识

接着看看wc命令的其他选项。

打印最长行的长度

wc可以借助-L选项打印最长行的长度:

  1. $ wc file -L