第八周笔记

awk 文本三剑客之一,文本处理工具

awk分为Gawk Pawk Dawk Centos用的是Gawk
模式扫描处理的语言
/user/bin/awk awk的路径

awk的使用语法
awk [选项] `program` var=value file…..(变量赋值)
awk [options] ‘program’ var=value file…
awk [options] -f programfile var=value file… -f 调用语言文件
awk [options] ‘BEGIN{ action;… } pattern{ action;… } END{ action;… }’ file …
awk 程序通常由:BEGIN语句块、能够使用模式匹配的通用语句块、END语句块,共3部
分组成
program通常是被单引号或双引号中

选项:
-F 指明输入时用到的字段分隔符
-v var=value: 自定义变量

行: 记录record 定义分隔符 一个分隔符算一行 (分隔符自定义 默认是空格)
列:字段 或者 域field 或者 属性 分割符之前的任意分开的算一个字段

基本格式:awk [options] ‘program’ file…
program:pattern{action statements;..}
pattern和action:
• pattern部分决定动作语句何时触发及触发事件
BEGIN,END
• action statements对数据进行处理,放在{}内指明
print, printf(打印里面的内容)
分割符、域和记录
• awk执行时,由分隔符分隔的字段(域)标记$1,$2..$n称为域标识。$0为所有域,
注意:和shell中变量$符含义不同
• 文件的每一行称为记录
• 省略action,则默认执行 print $0 的操作

awk的工作原理
第一步:执行BEGIN{action;… }语句块中的语句 BEGIN经常用于处理表头(开始)
 第二步:从文件或标准输入(stdin)读取一行,然后执行pattern{ action;… }语句块,它
逐行扫描文件,从第一行到最后一行重复这个过程,直到文件全部被读取完毕。
 第三步:当读至输入流末尾时,执行END{action;…}语句块 end做汇总用
 BEGIN语句块在awk开始从输入流中读取行之前被执行,这是一个可选的语句块,比如
变量初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中
 END语句块在awk从输入流中读取完所有的行之后即被执行,比如打印所有行的分析
结果这类信息汇总都是在END语句块中完成,它也是一个可选语句块
 pattern语句块中的通用命令是最重要的部分,也是可选的。如果没有提供pattern语句
块,则默认执行{ print } ,即打印每一个读取到的行,awk读取的每一行都会执行该语句块

print格式: print item1, item2, …
 要点:
(1) 逗号分隔符
(2) 输出的各item可以字符串,也可以是数值;当前记录的字段、变量或awk的表达式
(3) 如省略item,相当于print $0
示例:
awk ‘{print “hello,awk”}’

awk –F: ‘{print}’ /etc/passwd
awk –F: ‘{print “wang”}’ /etc/passwd
awk –F: ‘{print $1}’ /etc/passwd
awk –F: ‘{print $0}’ /etc/passwd
awk –F: ‘{print $1”\t”$3}’ /etc/passwd (\t)tab键 用换行符作为分割符
tail –3 /etc/fstab |awk ‘{print $2,$4}’ 倒数三行的$2$4字段

本文来自投稿,不代表Linux运维部落立场,如若转载,请注明出处:http://www.178linux.com/99003

(0)
上一篇 2018-05-20 17:47
下一篇 2018-05-20 18:54

相关推荐

  • 初学linux新手入门知识

    初学linux新手入门知识

    Linux笔记 2018-06-22
  • 如何制作LINUX服务脚本

    如何制作一个Linux启动服务          Linux在启动的时候都会跑很多系统自带的服务脚本,来控制系统服务的开启和关闭。这些服务是系统自带的,我们可以查看这些服务及其对应的脚本(ls /etc/init.d/)。这些服务有独立服务,也有依赖服务,依赖服务有被依赖服务和依赖别的服务。今天我们就来看看怎么来制作一个系统独立服务,方便我们以后需要自己手动…

    2018-05-10
  • 第一周总结

     ##### 存储网络: “` DAS—–直接连接存储(Direct attached storage) NAS—–网络连接存储(Network attached storage) SAN—–存储区域网络(storage area network) “` &#82…

    Linux笔记 2018-04-01
  • 第四章标准I/O和管道学习笔记

    本章内容

    三种I/O设备

    把I/O重定向至文件

    使用管道

    Linux笔记 2018-04-04
  • 软件包管理

    本章重点介绍rpm包管理器和rpm的使用

    Linux笔记 2018-04-19
  • 马哥教育 – 第二周作业

    一、Linux上的文件管理类命令都有哪些,其常用的使用方法及其相关示例演示。 <1>命令:CP 概念:用来将一个或多个源文件或者目录复制到指定的目的文件或目录。它可以将单个源文件复制成一个指定文件名的具体的文件或一个已经存在的目录下。cp命令还支持同时复制多个文件,当一次复制多个文件时,目标文件参数必须是一个已经存在的目录,否则将出现错误。 语法…

    2018-05-21