马哥教育网络班22期第五周博客作业

正则表达式与grep

文本编辑工具

    grep:是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来;

    sed :是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用;

    awk :是一种编程语言,用于在linux/unix下对文本和数据进行处理;

grep使用

    grep [OPTION] PATTERN [FILE…]

    grep [OPTIONS] [-e PATTERN | -f FILE] [FILE…]

    选项:

        –color=auto:自动加颜色;

        -i :ignorecase,忽略字符大小写;

        -o :仅显示匹配道德字符串本身;

        -v :–invert-match:显示不能被模式匹配到的行;

        -E :支持使用扩展的正则表达式元字符;

        -q :不输出任何信息;

        -A<显示列数>:除了显示符合范本样式的那一行之外,并显示该行之后的内容;

        -B<显示列数>:在显示符合范本样式的那一行之外,并显示该行之前的内容;

        -C<显示列数>:除了显示符合范本样式的那一列之外,并显示该列之前后的内容;

正则表达式

    正则表达式,又称规则表达式。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。

正则表达式元字符

    (1)字符匹配:

        . :匹配任意单个字符;

        [] :匹配指定范围内的任意单个字符;

        [^] :匹配指定范围外的任意单个字符;

    (2)匹配次数:

        * :匹配其前面的字符任意次;

        .* :匹配任意长度的任意字符;

        \? :匹配其前面的字符至多1次;

        \+ :匹配其前面的字符至少1次;

        \{m\} :匹配其前面的字符m次;

        \{m,n\} :匹配其前面的字符至少m次,至多n次;

            \{0,n\} :匹配其前面的字符至多n次;

            \{m,\} :匹配其前面的字符至少m次;

    (3)位置锚定:

        ^ :行首锚定;

        $ :行尾锚定;

        ^PATTERN$ :用PATTERN来匹配整行;

            ^$ :匹配空白行;

            ^[[:space:]]*$ :包含空白字符的行或空行;

        单词:非特殊字符组成的连续字符;

            \<或<b :词首锚定;

            \>或\b :词尾锚定;

            \<PATTERN\> :匹配完整单词;

    (4)分组及引用:

        \(\) :将一个或多个字符当作一个整体;分组括号中的内容会被记录于内部变量中,可作为引用;

        后向引用:    

            \1 :引用第一个括号中匹配到的字符;

            \2 :引用第二个括号中匹配到的字符;

            … …


示例

1.显示当前系统上root、fedora或user1用户的默认shell;

# less /etc/passwd | egrep "^(root|fedora|user1)\>" | cut -d: -f1,7
root:/bin/bash
user1:/bin/bash
fedora:/bin/bash

或

# less /etc/passwd | grep "^\(root\|fedora\|user1\)\>" | cut -d: -f1,7
root:/bin/bash
user1:/bin/bash
fedora:/bin/bash

2.找出/etc/rc.d/init.d/functions文件中某单词后面跟一组小括号的行,形如:hello();

# egrep "\<[[:alnum:]]+\(\)" /etc/rc.d/init.d/functions
checkpid() {
daemon() {
killproc() {
pidfileofproc() {
pidofproc() {
status() {
success() {
failure() {
passed() {
warning() {
action() {
strstr() {

3.使用echo命令输出一个绝对路径,使用grep取出其基名;

扩展:取出其路径名;

# echo "/var/log/cron" | egrep -o "[^/]+/?$"

# echo "/var/log/cron" | egrep -o "^(/[^/]+)+/$"

4.找出ifconfig命令结果中的1-255之间数字

# ifconfig | egrep -o "[1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]"

5.挑战题:写一个模式,能匹配合理的IP地址;

#ifconfig | egrep -o "([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])"

6.挑战题:写一个模式,能匹配出所有的邮件地址;

# egrep -o "[[:alnum:]]+\@[[:alnum:]]+\.[[:alnum:]]"

7.查找/var目录下属主为root,且属组为mail的所有文件或目录;

# find /var  -user root -a -group mail

8.查找当前系统上没有属主或属组的文件;

进一步:查找当前系统上没有属主或属组,且最近3天内曾被访问过的文件或目录;

# find / -nouser -o  -nogroup

# find / \( -nouser -o -nogroup \) -atime -3

9.查找/etc目录下所有用户都有写权限的文件;

# find /etc -perm -222

10.查找/etc目录下大于1M,且类型为普通文件的所有文件;

# find /etc/ -size +1M -type f -exec ls -lh {} \

11.查找/etc/init.d/目录下,所有用户都有执行权限,且其它用户有写权限的文件;

# find /etc/init.d/ -perm -113 -type f

12.查找/usr目录下不属于root、bin或hadoop的文件;

# find /usr/ -not \( -user root -o -user bin -o -user hadoop \)

13.查找/etc/目录下至少有一类用户没有写权限的文件;

# find /etc/ -not -perm -222

14.查找/etc目录下最近一周内其内容被修改过,且不属于root或hadoop的文件;

# find /etc -mtime -7 -a -not \( -user root -o -user hadoop \)

原创文章,作者:N22-无锡-沉默,如若转载,请注明出处:http://www.178linux.com/48939

(0)
N22-无锡-沉默N22-无锡-沉默
上一篇 2016-10-19 14:19
下一篇 2016-10-19 14:19

相关推荐

  • 根分区伸缩实验

    众所周知LVM是Linux环境下对 磁盘进行管理的一种机制。用户在安装Linux操作系统时,难以分配合适的硬盘空间,当一个分区存放不下某个文件时,这个文件因为文件系统的限制,也不能 跨越多个分区来存放。而遇到出现某个分区耗尽时,只有使用调整分区大小的工具。随着LVM功能的出现,这些问题都迎刃而解,用户在无需停机的情况下可以方 便…

    Linux干货 2015-05-27
  • 程序包管理之rpm

    程序包管理器不同公司的发行版:                         debian:dpt管理器 &…

    Linux干货 2016-08-22
  • linux 文件管理命令

    目录与路径    1.相对路径与绝对路径 因为我们在Linux系统中,常常要涉及到目录的切换,所以我们必须要了解 "路径" 以及 "相对路径" 与 "绝对路径" 的概念。在之前的学习中,就反复的强调了Linux的目录是 "树状目录" 。假设我们需要在任意一个目…

    Linux干货 2016-11-06
  • Tomcat公猫

    官方站点:http://tomcat.apache.org/ Tomcat是一个能够运行java页面(jsp)的java’web服务器程序;安装使用之前需要先安装jdk包 jdk是JAVA的开发工具包,已随base收录进来,安装jdk1.8版本:yum -y install java-1.8.0-openjdk-devel (其中jvm虚拟机的运行程序就叫j…

    2017-05-23
  • Linux进程及作业管理

    process 运行中的程序的一个副本,是被载入内存的一个指令集合 进程ID(Process ID,PID)号码被用来标记各个进程 UID、GID、和SELinux语境决定对文件系统的存取和访问权限, 通常从执行进程的用户来继承 存在生命周期 task struct:Linux内核存储进程信息的数据结构格式 task list:…

    Linux干货 2016-09-11
  • 马哥M20-1第一周作业

    作业1:通过echo实现字体闪烁,添加下划线,改变颜色      (1)添加下划线    (2)字体闪烁   (3)改变颜色 作业2:显示前10天的年月日 作业3:screen的使用

    Linux干货 2016-07-29

评论列表(1条)

  • 马哥教育
    马哥教育 2016-10-25 13:36

    第二个问题看一下man grep的参数