第八周笔记

awk 文本三剑客之一,文本处理工具

awk分为Gawk Pawk Dawk Centos用的是Gawk
模式扫描处理的语言
/user/bin/awk awk的路径

awk的使用语法
awk [选项] `program` var=value file…..(变量赋值)
awk [options] ‘program’ var=value file…
awk [options] -f programfile var=value file… -f 调用语言文件
awk [options] ‘BEGIN{ action;… } pattern{ action;… } END{ action;… }’ file …
awk 程序通常由:BEGIN语句块、能够使用模式匹配的通用语句块、END语句块,共3部
分组成
program通常是被单引号或双引号中

选项:
-F 指明输入时用到的字段分隔符
-v var=value: 自定义变量

行: 记录record 定义分隔符 一个分隔符算一行 (分隔符自定义 默认是空格)
列:字段 或者 域field 或者 属性 分割符之前的任意分开的算一个字段

基本格式:awk [options] ‘program’ file…
program:pattern{action statements;..}
pattern和action:
• pattern部分决定动作语句何时触发及触发事件
BEGIN,END
• action statements对数据进行处理,放在{}内指明
print, printf(打印里面的内容)
分割符、域和记录
• awk执行时,由分隔符分隔的字段(域)标记$1,$2..$n称为域标识。$0为所有域,
注意:和shell中变量$符含义不同
• 文件的每一行称为记录
• 省略action,则默认执行 print $0 的操作

awk的工作原理
第一步:执行BEGIN{action;… }语句块中的语句 BEGIN经常用于处理表头(开始)
 第二步:从文件或标准输入(stdin)读取一行,然后执行pattern{ action;… }语句块,它
逐行扫描文件,从第一行到最后一行重复这个过程,直到文件全部被读取完毕。
 第三步:当读至输入流末尾时,执行END{action;…}语句块 end做汇总用
 BEGIN语句块在awk开始从输入流中读取行之前被执行,这是一个可选的语句块,比如
变量初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中
 END语句块在awk从输入流中读取完所有的行之后即被执行,比如打印所有行的分析
结果这类信息汇总都是在END语句块中完成,它也是一个可选语句块
 pattern语句块中的通用命令是最重要的部分,也是可选的。如果没有提供pattern语句
块,则默认执行{ print } ,即打印每一个读取到的行,awk读取的每一行都会执行该语句块

print格式: print item1, item2, …
 要点:
(1) 逗号分隔符
(2) 输出的各item可以字符串,也可以是数值;当前记录的字段、变量或awk的表达式
(3) 如省略item,相当于print $0
示例:
awk ‘{print “hello,awk”}’

awk –F: ‘{print}’ /etc/passwd
awk –F: ‘{print “wang”}’ /etc/passwd
awk –F: ‘{print $1}’ /etc/passwd
awk –F: ‘{print $0}’ /etc/passwd
awk –F: ‘{print $1”\t”$3}’ /etc/passwd (\t)tab键 用换行符作为分割符
tail –3 /etc/fstab |awk ‘{print $2,$4}’ 倒数三行的$2$4字段

本文来自投稿,不代表Linux运维部落立场,如若转载,请注明出处:http://www.178linux.com/99003

发表评论

登录后才能评论

联系我们

400-080-6560

在线咨询:点击这里给我发消息

邮件:1823388528@qq.com

工作时间:周一至周五,9:30-18:30,节假日同时也值班