awk中pipe的shell命令调用与close()

    某公司其员工到勤时间表如下, 取名为 arr.dat, 文件中第一栏为员工代号, 第二栏为到达时间. 本示例中将使用该文件为数据示例文件,

1034 7:26

1025 7:27

1101 7:32

1006 7:45

1012 7:46

1028 7:49

1051 7:51

1029 7:57

1042 7:59

1008 8:01

1052 8:05

1005 8:12

要求: 

(1) 将数据arr.dat按员工ID排序, 并在表头附加上执行时的日期

(2) 在arr.dat之前增加一行数据抬头如下" ID Number Arrival Time"

(3) 若八点为上班时间, 请加标注"*" 与迟到时间之后, 并计算平均上班时间.

(4) 将arr.dat重新输出到today.art文件中

答案与解析:

建立文件名为reformat.awk的awk文件, 内容如下

BEGIN {
    FS="[ \t:]"  #此处重新定义输入字段分隔符, 默认值为空白, 此处使用 [ \t:]+ (为正则表达式) 表示 \
  使用 "空吧, tab或 : " 做组成的字符创做分隔符, + 表示可以出现一次或一次以上;
    "date" | getline  #此处为在awk中调用shell的命令, 需要使用 ""括主, 并且需要使用 pipe( | ) 传递给 getline(awk的内建函数, 用于调用shell命令);
    print " Today is ",$2, $3  > "today.art"   #输出重定向, 将输出重定向到today.art中, 并创建文件
    print "====================================" >> "today.art" # 使用>> 而非 > , >> 是在原有文件后面追加, > 是清空文件, 故使用 >>
    print " ID Number Arrival Time" >> "today.art"
    close("today.art")   #此处稍后解释
}
{
    arrival = HM_to_M( $2, $3 )  # 此处为awk中的自定义函数, 在后边定义, 是计算迟到时间, 将时间转换成分钟
    printf(" %s %s:%s %s\n", $1, $2, $3, arrival > 480 ? "*" : " ") | " sort -k 1 >> today.art" 
    # 通过重新定义FS, 将源文件 分割成3 段, 第2, 3段表示的时间, 其中arriva > 480 ? "*" : " "  为判断是否迟到, 迟到的后边增加标记 * , 480 为8点的分钟数
    # 通过 | 将命令暂存到 | 上, 并且不会执行输出, 也不会执行sort命令, 在awk全部执行完毕后, 才会执行
    total += arrival # 计算总的时间, 为了计算后边的平均到达时间
}
END {
    close("today.art")
    close("sort -k 1 >> today.art") 
    #awk中的close()指令, 语法有两种, close( filename ) 和close( 置于pipe之前的command ). 指令close( "sort -k 1 >> today.art" ) 
    #其意思是 close 程序中置于"sort -k 1 >> today.art "之前的pipe, 并立即调用shell来执行sort命令
    printf(" Average Arrival Time : %d:%d\n", arrival/NR/60, (arrival/NR)%60 ) >> "today.art"  #awk中"today.art"若表示文件名, 必须使用"' 括起来, 若不适用, 会被当做变量
    # 计算平均到达时间, NR是内建变量, 表示读入文件的总行数, arrival/NR/60 表示取整得到小时, (arrival/NR)%60 取余数得到分钟数;
}
function HM_to_M( hour, min ) {
    return hour*60 + min
}
# 自定义函数, 计算员工达到的分钟数, 与8点的分钟数480进行比较

 

最后通过 awk -f reformat.awk arr.dat 得到文件 today.art, 内容如下

 Today is  11月 08日

===================================

 ID Number Arrival Time

 1005 8:12 *

 1006 7:45  

 1008 8:01 *

 1012 7:46  

 1025 7:27  

 1028 7:49  

 1029 7:57  

 1034 7:26  

 1042 7:59  

 1051 7:51  

 1052 8:05 *

 1101 7:32  

原创文章,作者:black_fish,如若转载,请注明出处:http://www.178linux.com/58585

(0)
上一篇 2016-11-10 20:07
下一篇 2016-11-11 08:41

相关推荐

  • Linux简介,计算机基础

    计算机系统   计算机系统分为:  硬件(Hardware)系统和软件(Software)系统  硬件系统:    主机、外部设备  软件系统:  系统软件、应用软件  主机:  中面处理器CPU、内存储器  外部设备:  外部存储器、输入…

    Linux干货 2017-02-14
  • N23-卡卡琦-第一周

    1、描述计算机的组成及其功能 硬件: 控制器:是整个计算机的中枢神经,其功能是对程序规定的控制信息进行解释,根据其要求进行控制,调度程序、数据、地址,协调计算机各部分工作及内存与外设的访问等;运算器:运算器的功能是对数据进行各种算术运算和逻辑运算,即对数据进行加工处理;存储器:存储器的功能是存储程序、数据和各种信号、命令等信息,并在需要时提供这些信息;输入输…

    Linux干货 2016-11-16
  • vsftp简单应用

    vsftp配置详解 前言 FTP(File Transfer Protocol)是文件传输协议的简称。它能让用户 连接上一个远程计算机(运行着 FTP 服务器程序)查看远程 计算机上有哪些文件,然后把文件从远程计算机上下载到 本地计算机,或把本地计算机文件上传到远程计算机。但是ftp是一种古老的文件传输协议,是明文传输,特别的不安全所以就有了vsftp。 一…

    Linux干货 2016-12-18
  • tcpdump诊断nginx问题

    自从上级公司离职后,快一年的时间没有写php程序和搭建LNMP环境,一直在做db运维和运维工具开发方面的事情。 最近决定开发开发一些自动话方面工具,重新拾起php,于是在测试机上搭建一个LNMP环境。 1、 nginx 404错误 一般的出现404错误,找不到页面资源。首先用strace排除了存在文件访问权限的问题,其次nginx的root参数设置也没有任何…

    Linux干货 2016-05-03
  • 马哥教育的第一天

    春天的北京,比想象中的更加温暖,跨越一千三百公里的距离,我来到马哥教育位于北京昌平区的校区,传说中的春寒料峭似乎遗忘了北京,自湖北出门的时候,车外还是淅淅沥沥的小雨,到达北京,迎接我的却是春风拂面熏人醉。 安顿了两天之后,我们三十期的开班典礼在三月二十六号早上的九点钟准时开始,由云珍老师主持,传说中的马哥、王老师、张sir、宗华老师纷纷登台致辞,分别从运维工…

    2018-03-26
  • 软件包管理rpm和yum基本使用

    RPM是RedHat Package Manager(RedHat软件包管理工具)类似Windows里面的“添加/删除程序”因而广受欢迎。逐渐受到其他发行版的采用。RPM套件管理方式的出现,让Linux易于安装,升级,间接提升了Linux的适用度。 rpm 执行安装包 二进制包(Binary)以及源代码包(Source)两种。二进制包可以直接安装在计算机中,…

    Linux干货 2016-08-29