4 基本语法

AWK 使用起来非常方便。我们可以直接通过命令行的方式为 AWK 程序提供 AWK 命令,也可以使用包括 AWK 命令的脚本文件。这篇教程将使用合适的例子分别介绍这两种使用 AWK 的方法:

AWK 命令行

如下所示,在命令行中,我们可以使用如下的格式调用 AWK 命令,其中 AWK 命令由单引号括起来:

  1. awk [options] file ...

例子

假设我们有一个名为marks.txt的文件需要处理,文件中的内容如下:

  1. 1) Amit Physics 80
  2. 2) Rahul Maths 90
  3. 3) Shyam Biology 87
  4. 4) Kedar English 85
  5. 5) Hari History 89

我们可以按如下方式使用 AWK 命令输出整个文件中的内容:

  1. [jerry]$ awk '{print}' marks.txt

执行上面的命令可以得到如下的结果:

  1. 1) Amit Physics 80
  2. 2) Rahul Maths 90
  3. 3) Shyam Biology 87
  4. 4) Kedar English 85
  5. 5) Hari History 89

AWK 程序文件

接下来讲解的是另外一种提供 AWK 命令的方式——通过脚本文件提供:

  1. awk [option] -f file ....

首先,创建一个文本文件 command.awk,在文件中输入如下 AWK 命令:

  1. {print}

现在,我们可以调用 AWK 从文本文件中读入命令并执行。这里,我们实现了与上面例子相同的效果:

  1. [jerry]$ awk -f command.awk marks.txt

执行上面的命令可以得到如下的结果:

  1. 1) Amit Physics 80
  2. 2) Rahul Maths 90
  3. 3) Shyam Biology 87
  4. 4) Kedar English 85
  5. 5) Hari History 89

AWK 标准选项

在命令行环境下,AWK 支持如下的标准选项:

-v 选项

这个选项可以为变量赋值。它允许在程序执行之前为变量赋值。下面是一个 -v 选项使用的示例程序:

  1. [jerry]$ awk -v name=Jerry 'BEGIN{printf "Name = %s\n", name}'

执行上面的命令可以得到如下的结果:

  1. Name = Jerry

—dump-variables[=file] 选项

此选项会将全局变量及相应值按序输出到指定文件中。默认的输出文件名是 awkvars.out

  1. [jerry]$ awk --dump-variables ''
  2. [jerry]$ cat awkvars.out

执行上面的命令可以得到如下的结果:

  1. ARGC: 1
  2. ARGIND: 0
  3. ARGV: array, 1 elements
  4. BINMODE: 0
  5. CONVFMT: "%.6g"
  6. ERRNO: ""
  7. FIELDWIDTHS: ""
  8. FILENAME: ""
  9. FNR: 0
  10. FPAT: "[^[:space:]]+"
  11. FS: " "
  12. IGNORECASE: 0
  13. LINT: 0
  14. NF: 0
  15. NR: 0
  16. OFMT: "%.6g"
  17. OFS: " "
  18. ORS: "\n"
  19. RLENGTH: 0
  20. RS: "\n"
  21. RSTART: 0
  22. RT: ""
  23. SUBSEP: "\034"
  24. TEXTDOMAIN: "messages"

—help 选项

此选项将帮助消息转出到标准输出中。

  1. [jerry]$ awk --help

执行上面的命令可以得到如下的结果:

  1. Usage: awk [POSIX or GNU style options] -f progfile [--] file ...
  2. Usage: awk [POSIX or GNU style options] [--] 'program' file ...
  3. POSIX options: GNU long options: (standard)
  4. -f progfile --file=progfile
  5. -F fs --field-separator=fs
  6. -v var=val --assign=var=val
  7. Short options: GNU long options: (extensions)
  8. -b --characters-as-bytes
  9. -c --traditional
  10. -C --copyright
  11. -d[file] --dump-variables[=file]
  12. -e 'program-text' --source='program-text'
  13. -E file --exec=file
  14. -g --gen-pot
  15. -h --help
  16. -L [fatal] --lint[=fatal]
  17. -n --non-decimal-data
  18. -N --use-lc-numeric
  19. -O --optimize
  20. -p[file] --profile[=file]
  21. -P --posix
  22. -r --re-interval
  23. -S --sandbox
  24. -t --lint-old
  25. -V --version

—lint[=fatal] 选项

这个选项用于检查程序的可移植情况以及代码中的可疑部分。如果提供了参数 fatal,AWK 会将所有的警告信息当作错误信息处理。下面这个简单的示例说明了 lint 选项的用法:

  1. [jerry]$ awk --lint '' /bin/ls

执行上面的命令可以得到如下的结果:

  1. awk: cmd. line:1: warning: empty program text on command line
  2. awk: cmd. line:1: warning: source file does not end in newline
  3. awk: warning: no program text at all!

—posix 选项

这个选项会打开严格 POSIX 兼容性审查。 如此,所有共同的以及 GAWK 特定的扩展将被设置为无效。

—profile[=file] 选项

这个选项会将程序文件以一种很优美的方式输出(译注:用于格式化 awk 脚本文件)。默认输出文件是 awkprof.out。示例如下:

  1. [jerry]$ awk --profile 'BEGIN{printf"---|Header|--\n"} {print} END{printf"---|Footer|---\n"}' marks.txt > /dev/null
  2. [jerry]$ cat awkprof.out

执行上面的命令可以得到如下的结果:

  1. \# gawk profile, created Sun Oct 26 19:50:48 2014
  2.  
  3. # BEGIN block(s)
  4.  
  5. BEGIN {
  6. printf "---|Header|--\n"
  7. }
  8.  
  9. # Rule(s)
  10.  
  11. {
  12. print $0
  13. }
  14.  
  15. # END block(s)
  16.  
  17. END {
  18. printf "---|Footer|---\n"
  19. }

—traditional 选项

此选项用于禁止 GAWK 相关的扩展。

—version 选项

此选项显示 AWK 程序的版本信息。

  1. [jerry]$ awk --version

上面的代码执行后,将产生下面的输出结果(译注:与具体的 AWK 版本相关):

  1. GNU Awk 4.0.1
  2. Copyright (C) 1989, 1991-2012 Free Software Foundation.