第八周笔记

awk 文本三剑客之一,文本处理工具

awk分为Gawk Pawk Dawk Centos用的是Gawk
模式扫描处理的语言
/user/bin/awk awk的路径

awk的使用语法
awk [选项] `program` var=value file…..(变量赋值)
awk [options] ‘program’ var=value file…
awk [options] -f programfile var=value file… -f 调用语言文件
awk [options] ‘BEGIN{ action;… } pattern{ action;… } END{ action;… }’ file …
awk 程序通常由:BEGIN语句块、能够使用模式匹配的通用语句块、END语句块,共3部
分组成
program通常是被单引号或双引号中

选项:
-F 指明输入时用到的字段分隔符
-v var=value: 自定义变量

行: 记录record 定义分隔符 一个分隔符算一行 (分隔符自定义 默认是空格)
列:字段 或者 域field 或者 属性 分割符之前的任意分开的算一个字段

基本格式:awk [options] ‘program’ file…
program:pattern{action statements;..}
pattern和action:
• pattern部分决定动作语句何时触发及触发事件
BEGIN,END
• action statements对数据进行处理,放在{}内指明
print, printf(打印里面的内容)
分割符、域和记录
• awk执行时,由分隔符分隔的字段(域)标记$1,$2..$n称为域标识。$0为所有域,
注意:和shell中变量$符含义不同
• 文件的每一行称为记录
• 省略action,则默认执行 print $0 的操作

awk的工作原理
第一步:执行BEGIN{action;… }语句块中的语句 BEGIN经常用于处理表头(开始)
 第二步:从文件或标准输入(stdin)读取一行,然后执行pattern{ action;… }语句块,它
逐行扫描文件,从第一行到最后一行重复这个过程,直到文件全部被读取完毕。
 第三步:当读至输入流末尾时,执行END{action;…}语句块 end做汇总用
 BEGIN语句块在awk开始从输入流中读取行之前被执行,这是一个可选的语句块,比如
变量初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中
 END语句块在awk从输入流中读取完所有的行之后即被执行,比如打印所有行的分析
结果这类信息汇总都是在END语句块中完成,它也是一个可选语句块
 pattern语句块中的通用命令是最重要的部分,也是可选的。如果没有提供pattern语句
块,则默认执行{ print } ,即打印每一个读取到的行,awk读取的每一行都会执行该语句块

print格式: print item1, item2, …
 要点:
(1) 逗号分隔符
(2) 输出的各item可以字符串,也可以是数值;当前记录的字段、变量或awk的表达式
(3) 如省略item,相当于print $0
示例:
awk ‘{print “hello,awk”}’

awk –F: ‘{print}’ /etc/passwd
awk –F: ‘{print “wang”}’ /etc/passwd
awk –F: ‘{print $1}’ /etc/passwd
awk –F: ‘{print $0}’ /etc/passwd
awk –F: ‘{print $1”\t”$3}’ /etc/passwd (\t)tab键 用换行符作为分割符
tail –3 /etc/fstab |awk ‘{print $2,$4}’ 倒数三行的$2$4字段

本文来自投稿,不代表Linux运维部落立场,如若转载,请注明出处:http://www.178linux.com/99003

(0)
上一篇 2018-05-20 17:47
下一篇 2018-05-20 18:54

相关推荐

  • Linux学习笔记——权限管理

    Linux学习笔记——权限管理 前言: Linux下的权限管理与日常使用的windows有众多与众不同之处。这些特性使得Linux在实际生产作业中更加安全与高效,发挥着各种灵活的作用。本文简要写下笔者对Linux权限管理的理解,供参考与复习,欢迎指正。 回顾: 确认文件的权限与所有者: 使用ll(即ls -l) 命令可查看这个文件的详细信息。 $ ll da…

    2018-04-07
  • systemd及awk简介

    systemd及awk简介

    Linux笔记 2018-04-20
  • 网络管理

    tcp udp 三次握手四次挥手 子网划分 ip nmcli

    2018-05-02
  • LAMP、php、mariadb

    LAMP: a:apache m:mariadb、mysql p:php,perl,python LAMMP:memcached   静态资源:静态内容,客户端从服务器获得的资源的表现形式与源文件相同; 动态资源:通常是程序文件,需要在服务器执行之后,将执行的结果返回给客户端; CGI:common gateway interface通用网关接口 …

    Linux笔记 2018-05-21
  • Linux学习前的准备

    计算机组成;Linux发行版;Linux基础命令

    2018-06-25
  • 计算机构成简介与Linux基础知识

        ◆ 命令—Linux学习的基础,而基础就是核心。◆ 没有基础就只如空中楼阁,每次处理问题的时候,都需要向外界的力量求教,而缺乏自己解决问题的能力。◆ 学习比较被动,知识的储备速度不能紧跟使用需求。◆ SO,夯实基础反而成为重中之重。想要万丈高楼平地起,就先打好地基,在人们还看不见的时候,挥洒着汗水;而时间会给你成长的回报! 一、计算机构成与功能简介 …

    Linux笔记 2018-04-03