根据作业浅析正则表达式

    什么是正则?正则就是,那种体现出某种规律的不变性或者对称性的物理量或关系。
    正则表达式(Regular Expression):由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符)不表示字符字面意义,而表示控制或通配的功能(linux中,可以使用:man 7 regex命令查看。)
程序支持: grep,sed,awk,vim, less,nginx,varnish等
    分类:基本正则表达式: BRE
扩展正则表达式: ERE
    元字符分类:字符匹配、匹配次数、位置锚定、分组。
    本篇文章通过一些作业题来浅析正则表达式的用法。
1、显示/proc/meminfo文件中以大小s开头的行?
答案:
[root@CentOS7 ~]# grep “^[S\|s]” /proc/meminfo
SwapCached:            0 kB
SwapTotal:          2044 kB
SwapFree:           2044 kB
Shmem:              9108 kB
Slab:                   65388 kB
SReclaimable:      25776 kB

    其中,正则表达式^[S\|s]中 ,S\|s 表示“S或s”的意思;

[S\|s]表示匹配S或者s;

^[S\|s]表示匹配以S为行首或者以s为行首的行。

2、显示/etc/passwd文件中不以/bin/bash结尾的行?

答案:
[root@CentOS7 ~]# cat /etc/passwd | grep -v “/bin/bash$”
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
nobody:x:99:99:Nobody:/:/sbin/nologin
systemd-bus-proxy:x:999:998:systemd Bus Proxy:/:/sbin/nologin
systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin
dbus:x:81:81:System message bus:/:/sbin/nologin
polkitd:x:998:997:User for polkitd:/:/sbin/nologin
abrt:x:173:173::/etc/abrt:/sbin/nologin
unbound:x:997:996:Unbound DNS resolver:/etc/unbound:/sbin/nologin
tss:x:59:59:Account used by the trousers package to sandbox the tcsd daemon:/dev/null:/sbin/nologin
libstoragemgmt:x:996:995:daemon account for libstoragemgmt:/var/run/lsm:/sbin/nologin
rpc:x:32:32:Rpcbind Daemon:/var/lib/rpcbind:/sbin/nologin
colord:x:995:994:User for colord:/var/lib/colord:/sbin/nologin
usbmuxd:x:113:113:usbmuxd user:/:/sbin/nologin
saslauth:x:994:76:Saslauthd user:/run/saslauthd:/sbin/nologin
geoclue:x:993:991:User for geoclue:/var/lib/geoclue:/sbin/nologin
rtkit:x:172:172:RealtimeKit:/proc:/sbin/nologin
radvd:x:75:75:radvd user:/:/sbin/nologin
rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin
nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin
qemu:x:107:107:qemu user:/:/sbin/nologin
chrony:x:992:989::/var/lib/chrony:/sbin/nologin
setroubleshoot:x:991:988::/var/lib/setroubleshoot:/sbin/nologin
pulse:x:171:171:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
gdm:x:42:42::/var/lib/gdm:/sbin/nologin
gnome-initial-setup:x:990:985::/run/gnome-initial-setup/:/sbin/nologin
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
avahi:x:70:70:Avahi mDNS/DNS-SD Stack:/var/run/avahi-daemon:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
ntp:x:38:38::/etc/ntp:/sbin/nologin
tcpdump:x:72:72::/:/sbin/nologin
mailnull:x:47:47::/var/spool/mqueue:/sbin/nologin
smmsp:x:51:51::/var/spool/mqueue:/sbin/nologin
nologin:x:1014:1018::/home/nologin:/sbin/nologin

    其中,”/bin/bash”表示匹配”/bin/bash”字符串。

“/bin/bash”$表示匹配以”/bin/bash”字符串为行尾的行。

3、显示用户rpc默认的shell程序?

答案:
[root@CentOS7 ~]# cat /etc/passwd | grep “^rpc\>”
rpc:x:32:32:Rpcbind Daemon:/var/lib/rpcbind:/sbin/nologin
[root@CentOS7 ~]# cat /etc/passwd | grep “^rpc\>” | cut -d: -f7
/sbin/nologin

    其中,因为passwd文件,第一列内容为用户,所以,需要用到^。

正则表达式rpc\>表示,匹配以rpc为单词词尾的内容。(\>表示单词词尾,$表示行尾,两者不一样)。

^rpc\>表示匹配以rpc单词为行首的内容。

4、找出/etc/passwd中的两位或三位数?
答案:
[root@CentOS7 ~]# cat /etc/passwd |grep -o “\<[0-9]\{2,3\}\>”
12
11
12
100
14
50
99
99
999
998
192
192
81
81
998
997
173
173

首先打开/etc/passwd文件,发现“root:x:0:0:root:/root:/bin/bash”,数字位为UID、GID,并且数字位前后均有“:”,所以有人可能会使用”:[0-9]\{2,3\}:”(小编就是),其实,这样只能读取类似于“:51:”的数字,并且只能读取UID一列,类似于“smmsp:x:51:51::/var/spool/mqueue:/sbin/nologin”。这种不太符合标准(如果不理解原因的话,可以查看附注1)。另外描述位上也可能有数字。所以,必须使用”\<[0-9]\{2,3\}\>”,以二位或者三位数字组成的词语。

5、显示CentOS7的/etc/grub2.cfg文件中,至少以一个空白字符开头的且后面存非空白字符的行?

答案:
[root@CentOS7 app]# cat /etc/grub2.cfg |grep “^[[:space:]]\+[^[:space:]]”
  load_env
   set default=”${next_entry}”
   set next_entry=
   save_env next_entry
   set boot_once=true
   set default=”${saved_entry}”
  menuentry_id_option=”–id”
  menuentry_id_option=””
  set saved_entry=”${prev_saved_entry}”
  save_env saved_entry
  set prev_saved_entry=
  save_env prev_saved_entry
  set boot_once=true
  if [ -z “${boot_once}” ]; then
    saved_entry=”${chosen}”
    save_env saved_entry
  fi
  if [ x$feature_all_video_module = xy ]; then
    insmod all_video
  else
    insmod efi_gop
    insmod efi_uga
    insmod ieee1275_fb
    insmod vbe
    insmod vga
    insmod video_bochs
    insmod video_cirrus
  fi
  set timeout_style=menu
  set timeout=5
  set timeout=5
  source ${prefix}/user.cfg
  if [ -n “${GRUB2_PASSWORD}” ]; then
    set superusers=”root”
    export superusers
    password_pbkdf2 root ${GRUB2_PASSWORD}
  fi
    load_video
    set gfxpayload=keep
    insmod gzio
    insmod part_msdos
    insmod xfs
    set root=’hd0,msdos1′
    if [ x$feature_platform_search_hint = xy ]; then
      search –no-floppy –fs-uuid –set=root –hint-bios=hd0,msdos1 –hint-efi=hd0,msdos1 –hint-baremetal=ahci0,msdos1 –hint=’hd0,msdos1′  a655f87c-5a43-46d5-a9aa-650ffd5fd40a
    else
      search –no-floppy –fs-uuid –set=root a655f87c-5a43-46d5-a9aa-650ffd5fd40a
    fi
    linux16 /vmlinuz-3.10.0-514.el7.x86_64 root=UUID=5dd1d7a4-ba0e-4291-aef0-a9648fc8fefe ro rhgb quiet LANG=en_US.UTF-8
    initrd16 /initramfs-3.10.0-514.el7.x86_64.img
    load_video
    insmod gzio
    insmod part_msdos
    insmod xfs
    set root=’hd0,msdos1′
    if [ x$feature_platform_search_hint = xy ]; then
      search –no-floppy –fs-uuid –set=root –hint-bios=hd0,msdos1 –hint-efi=hd0,msdos1 –hint-baremetal=ahci0,msdos1 –hint=’hd0,msdos1′  a655f87c-5a43-46d5-a9aa-650ffd5fd40a
    else
      search –no-floppy –fs-uuid –set=root a655f87c-5a43-46d5-a9aa-650ffd5fd40a
    fi
    linux16 /vmlinuz-0-rescue-e6ba125df94b4c528eaad6f794db213e root=UUID=5dd1d7a4-ba0e-4291-aef0-a9648fc8fefe ro rhgb quiet
    initrd16 /initramfs-0-rescue-e6ba125df94b4c528eaad6f794db213e.img
  source ${config_directory}/custom.cfg
  source $prefix/custom.cfg;

其中,正则表达式”^[[:space:]]\+[^[:space:]]”中,

^[[:space:]]表示以空白字符为行首;

^[[:space:]]\+表示以不止一个空白字符为行首;

[^[:space:]]表示非空白字符。(两个^的含义不一样!)

6、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多个空白字符结尾的行?
答案:
[root@CentOS7 app]# netstat -tan |grep “LISTEN[[:space:]]*$”
tcp        0      0 0.0.0.0:111                     0.0.0.0:*               LISTEN     
tcp        0      0 192.168.122.1:53          0.0.0.0:*               LISTEN     
tcp        0      0 0.0.0.0:22                       0.0.0.0:*               LISTEN     
tcp        0      0 127.0.0.1:631                 0.0.0.0:*               LISTEN     
tcp6      0      0 :::111                                   :::*                    LISTEN     
tcp6      0      0 :::22                                     :::*                    LISTEN     
tcp6      0      0 ::1:631                                :::*                    LISTEN

正则表达式”LISTEN[[:space:]]*$”,

其中LISTEN[[:space:]]表示字符串“LISTEN”后面跟了一个空白字符;

LISTEN[[:space:]]*表示字符串“LISTEN”后面跟了任意多个空白字符;

LISTEN[[:space:]]*$表示字符串“LISTEN”后面跟了任意多个空白字符,直到行尾,都是空白字符。

7、显示CentOS7上所有系统用户的用户名和UID?
答案:
[root@CentOS7 app]# cat /etc/passwd |grep “:[1-9][0-9]\{0,2\}:” |cut -d: -f1,3
bin:1
daemon:2
adm:3
lp:4
sync:5
shutdown:6
halt:7
mail:8
operator:11
games:12
ftp:14
nobody:99
systemd-bus-proxy:999
systemd-network:192
dbus:81
polkitd:998
abrt:173
unbound:997
tss:59
libstoragemgmt:996
rpc:32
colord:995
usbmuxd:113
saslauth:994
geoclue:993
rtkit:172
radvd:75
rpcuser:29
qemu:107
chrony:992
setroubleshoot:991
pulse:171
gdm:42
gnome-initial-setup:990
sshd:74
avahi:70
postfix:89
ntp:38
tcpdump:72
mailnull:47
smmsp:51

CentOS7系统中,系统用户的UID为(1-999),题目要求只要系统用户的用户名和UID,所以,可以使用”:[1-9][0-9]\{0,2\}:”,另外,也可以使用”\<[[:digit:]]\{1,3\}\>”$,两个正则表达式的结果一样。

[0-9]\{0,2\}表示0-9的数字至少0个,至多2个。

同理,[[:digit:]]\{1,3\}表示0-9的数字至少1个,至多3个。

8、添加用户bash、testbash、basher、sh、nologin(其shell为/sbin/nologin),找出/etc/passwd用户名同shell名的行?
答案:
[root@CentOS7 app]# useradd bash
[root@CentOS7 app]# useradd testbash
[root@CentOS7 app]# useradd basher
[root@CentOS7 app]# useradd sh
[root@CentOS7 app]# useradd nologin -s /sbin/nologin
[root@CentOS7 app]# cat /etc/passwd | grep “\(^.*\)\>.*\/\1$”
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
bash:x:1011:1011::/home/bash:/bin/bash
nologin:x:1015:1018::/home/nologin:/sbin/nologin
首先需要添加用户,并且指定最后一个用户的shell为/sbin/nologin。其中,正则表达式”\(^.*\)\>.*\/\1$”。该题用到了后向引用。一定要注意,后向引用引用的是前面的“()”中匹配到的字符。并不是“()”中的模式。(不理解的话,可以查看附属2)。\(^.*\)表示匹配以任意字符串为行首的字符串;\(^.*\)\>.*表示匹配以任意字符串为行首,并且后面为任意字符(除了\n);\1表示“\(^.*\)”匹配到的字符串;\1$表示匹配以“\(^.*\)”匹配到的字符串为行尾;\/表示一个“/”;
\(^.*\)\>.*\/\1$表示行首行尾相同,并且,行尾所匹配的字符串前面还有一个“/”,防止出现类似于,用户名为“sh”而起shell为“bash”的情况。
9、仅利用df和grep和sort,取出磁盘各分区利用率,并从大到小排序?
答案:
[root@CentOS7 app]# df | grep -o ” [0-9]\{1,3\}%” |sort -nr
17%
10%
1%
1%
0%
0%
0%
0%
附属1:grep匹配的时候,例如第一行的“:051:32:”,匹配到了“:051:”后,则该行只剩下“32:”,所以,无法匹配。第二行的“:051::32:”,匹配到了“:051:”后,则该行只剩下“032:”,依然符合标准匹配。第三行同理。
[root@CentOS7 app]# cat test
:051:32:
:051::32:
:051:::32:
[root@CentOS7 app]# cat test |grep -o “:[0-9]\{2,3\}:”
:051:
:051:
:32:
:051:
:32:
属2grep匹配的时候,第二行为“rootrootraat”,\(r..t\)匹配到“root”,那么\1就代表“root”。第三行,“rootraatraat”,当\(r..t\)匹配到“root”的时候,\1就代表“root”,但是满足不了,所以便放弃。当\(r..t\)匹配到“raat”的时候,\1就代表“raat”,可以满足匹配条件!
[root@CentOS7 app]# cat test
rootrootroot
rootrootraat
rootraatraat
[root@CentOS7 app]# cat test |grep -o “\(r..t\).*\1”
rootrootroot
rootroot

raatraat


作业:
1、显示三个用户root、mage、wang的UID和默认shell
cat /etc/passwd|grep -E “^(root|wang|mage)\>”|cut -d : -f3,7
cat /etc/passwd|grep -E -w “^(root|wang|mage)”|cut -d : -f3,7
2、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一个小括号的行
cat /etc/rc.d/init.d/functions | grep “^[A-Za-z_][[:alpha:]]\+(.*”
3、使用egrep取出/etc/rc.d/init.d/functions中其基名
echo “/etc/rc.d/init.d/functions” | egrep -o “/[a-Z]+”$
4、使用egrep取出上面路径的目录名
echo “/etc/rc.d/init.d/functions” | egrep -o “^/.*/”
5、统计last命令中以root登录的每个主机IP地址登录次数
last | egrep “^root\>” |egrep “[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3} ” | tr -s ” ” |cut -d ” ” -f 3 | sort | uniq -c
6、显示ifconfig命令结果中所有IPv4地址
ifconfig |egrep -o “[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3} “
7、将此字符串:welcome to magedu linux 中的每个字符去重并排序,重复次数多的排到前面
echo “welcome to magedu linux” |tr -d ” ” |egrep -o “.” |sort |uniq -c |sort -nr

原创文章,作者:156,如若转载,请注明出处:http://www.178linux.com/83294

(0)
上一篇 2017-07-30 15:55
下一篇 2017-07-30 16:33

相关推荐

  • 脚本函数与程序包管理

    一、函数调用 1.while循环的特殊用法(遍历文件的每一行): while read line; do    循环体done < /PATH/FROM/SOMEFILE 依次读取/PATH/FROM/SOMEFILE文件中的每一行,且将行赋值给变量line示例:扫描/etc/passwd文件每一行,如发现GECOS字段为…

    Linux干货 2016-08-21
  • 生产环境日志审计

         日志审计,就是记录所有系统和相关用户行为的信息,并且可以自动分析,处理。在中小企业环境中,一般都是在单个服务器上记录日志,而大型企业的生产环境当中,会有专门的日志服务器乃至集群。本文通过sudo配合centos自带的rsyslog(syslog)服务,进行日志审计。    &nb…

    Linux干货 2016-10-20
  • 磁盘管理初级

    1、lsblk命令:显示系统上所有可用块设备信息 lsblk [options] [device…]          NAME           &nbs…

    Linux干货 2016-08-29
  • linux 常用命令

    命令1 rm 作用: 删除指定的文件  选项 作用 -f 强制删除 -i 删除前提示询问 -r  或  -R 递归处理,删除指定目录下的所有文件包括子目录 -v 显示指令执行过程 -d 直接把删除目录的硬连接数据删成零,删除该目录 命令2 终端(tty): 终端类型 开启方式 物理终端 console 控制台console 虚拟…

    Linux干货 2017-07-13
  • shell编程及小命令

    1. ping 10.1.252.25d2 -c1 -w1 &> /dev/null && echo "The host is up" || echo "The host is down" 2. 在vim命令中, p或则P可以实现复制。     p: 复制到下一行 &n…

    Linux干货 2016-08-12
  • DNS原理详解02

    9、子域授权     1、在父域的区域配置文件中增加以下记录,即为增加了子域授权            opt.patrickli.com.         IN      NS     &…

    Linux干货 2016-08-29