awk
awk是一种可以处理数据、产生格式化报表的语言。awk的工作方式是读取数据文件,将每一行数据视为一条记录,每条记录以分隔符分成若干字段,然后输出。awk常用的格式:
- awk ‘样式’ 文件,把符合样式的数据显示出来。
- awk ‘{操作}’ 文件,对每一行都执行{}中的操作。
- awk ‘样式{操作}’ 文件,对符合样式的数据进行括号里的操作。
$ echo 'BEGIN' | awk '{print $0 "\nline one\nline two\nline three"}'
BEGIN
line one
line two
line three
$ route -n | awk '/UG[ \t]/{print $2}'
$ awk '{s+=$1} END {printf "%.0f", s}' mydatafile
awk '/La/' 1.log
awk '{print $1, $2}' 1.log
awk '/La/{print $1, $2}' 1.log
$ awk 'BEGIN {count=0}{count++} END{print count}' /etc/passwd
$ awk -F ':' 'BEGIN {count=0;} {name[count] = $1;count++;}; END{for (i = 0; i < NR; i++) print i, name[i]}' /etc/passwd
$ awk -F : 'NR > 1 && NR <=5 {print $1}' /etc/passwd
$ awk '!visited[$0]++' your_file > deduplicated_file
$ awk -F : '/^root/{print $1, $2}' /etc/passwd
awk也常用于与其他系统命令的协同操作:
$ free -m | grep buffers\/ | awk '{print $NF}'
$ ps aux | awk '{print $2}'
内置变量
ARGC 命令行参数个数
ARGV 命令行参数排列
ENVIRON 支持队列中系统环境变量的使用
FILENAME awk浏览的文件名
FNR 浏览文件的记录数
FS 设置输入域分隔符,等价于命令行 -F选项
NF 浏览记录的域的个数
NR 已读的记录数
OFS 输出域分隔符
ORS 输出记录分隔符
RS 控制记录分隔符