正则表达式及其用法

正则表达式及其用法

1.   什么是正则表达式

正则表达式是Global search REgular expression and Print out the line的缩写。是一类用字符所书写的模式,其中许多字符并不表示其字面意义,而是表达控制或通配等功能。

在Linux中,用正则表达式搜索文本的常用命令:

grep: 使用基本正则表达式匹配文本。

egrep:使用扩展正则表达式匹配文本,同: grep –E。

fgrep: 快速grep,不支持正则表达式,不识别元字符。

    语法格式:

      grep [option]… 'PATTERN' FILE…

2.   基本正则表达式

    (1)     字符匹配

(a)  .: 匹配任意单个字符。

(b)  []:匹配指定范围内的任意单个字符。

[0-9] 或[[:num:]]:匹配任意当个数字

[a-z]或[[:lower:]]:匹配任意单个小写字母

[A-Z]或[[:upper:]]:匹配任意一个大写字母

[[:space:]]:匹配空格或制表符

[[:punct:]]:匹配特殊字符

[[:alpha:]]:匹配单个任意字符

[[:alnum:]]:匹配单个字母或数字

(c)  [^]:匹配不包括指定范围内的任意单个字符。

   (2)     次数匹配

a*: 匹配它前面出现的字符任意次。

b\?: 匹配它前面的字符0次或1次。

c\{m\}: 匹配它前面出现的字符m次。

d\{m,n\}: 匹配它前面出现的字符至少m次,至多n次。

e\{m,\}: 匹配它前面出现的字符至少m次。

f\{,n\}: 匹配它前面出现的字符至多n次。

g.*: 匹配任意长度的任意字符.

  (3)     位置锚定

a^: 锚定句首,写在模式的最左面。

b$: 锚定句尾,写在模式的最右端。

c\<: 锚定词首,写在模式的最左面。

d\>: 锚定词尾,写在模式的最右面。

e.* : 空白行

  (4)     分组\(\)

       分组中的模式匹配到的内容,可由正则表达式引擎记忆在内存中,之后可被引用。

  (5)     引用 \#

引用第#个括号中匹配到的内容,而不是模式本身。

如:\(ab\?c\).*\1    abcmnabc 匹配

3.   扩展正则表达式

  (1)     字符匹配(同基本正则表达式)

(a)  .: 匹配任意单个字符。

(b)  []:匹配指定范围内的任意单个字符。

(c)  [^]:匹配不包括指定范围内的任意单个字符。

  (2)     次数匹配

a*: 匹配它前面出现的字符任意次。

b?: 匹配它前面的字符0次或1次。

c+: 匹配前面出现的字符至少一次。

c{m}: 匹配它前面出现的字符m次。

d{m,n}: 匹配它前面出现的字符至少m次,至多n次。

e{m,}: 匹配它前面出现的字符至少m次。

f{,n}: 匹配它前面出现的字符至多n次。

  (3)     位置锚定 (同基本正则表达式)

  (4)     分组()

  (5)     引用 \# (同基本正则表达式)

  (6)     或者  |

  如:a|b   表示 a或b

      ab|cd 表示 ab或cd

练习:

1.新建一个文本文件,假设有如下内容:

            He like his lover.

            He love his lover.

            He like his liker.

            He love his liker.

        找出其中最后一个单词是由此前某单词加r构成的行。

[root@centos7 ~]# cat ./liker.txt 

He like his lover.

He love his lover.

He like his liker.

He love his liker.

[root@centos7 ~]# grep '\<\(.*\)\>.*\1r' ./liker.txt 

He love his lover.

He like his liker.

[root@centos7 ~]# 

2.写一个模式,能匹配合理的ipv4地址;1.0.0.0-239.255.255.255

[root@centos7 ~]# cat ./ip.txt                       

249.1.0.1

229.2.1111.1

0.0.0.0

255.255.255.255

239.255.255.255

1.0.0.0

1000.0.0.0.0

1.1000.0.0

1.2.2000.0

1.2.3.4000

127.0.1.10

[root@centos7 ~]# grep -o -E '\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-3][0-9])((\.)([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}\>' ./ip.txt 

239.255.255.255

1.0.0.0

1.2.3.40

127.0.1.10

[root@centos7 ~]# 

原创文章,作者:浪迹天涯,如若转载,请注明出处:http://www.178linux.com/7969

(0)
上一篇 2015-09-14 09:19
下一篇 2015-09-14 09:21

相关推荐

  • 2016-10-17作业

    1 生产环境发现一台服务器系统时间产生偏差,造成服务异常,请帮忙校正。 date命令查看系统时间,clock或者hwclock命令查看硬件时间, 将系统时间同步到硬件时间的方法hwclock -s   2 生产有一个数据同步脚本需要执行很长时间,怎样做到无人值守,在管理工具退出的情况下,脚本依然能正常运行。在生产环境的中创建SCREEN会话,会话的…

    Linux干货 2016-10-18
  • 第一周博客作业-Linux发行版历史、哲学思想、FHS、命令格式、帮助等

    All + All – 第一周作业 1.计算机组成及功能 计算机组成 硬件 冯诺依曼体系 CPU 运算器 对数据做算暖苏运算和逻辑运算 控制器 寄存器等 程序的运行,是CPU通过调用硬盘中的程序至内存中执行来实现的 存储器 内存 ROM RAM 外存 硬盘 光盘 输入设备 鼠标、麦克风等 实现指令和参数的输入 输出设备 显示器、打印机等 实现结果…

    Linux干货 2017-07-02
  • N25第二周作业

    1、Linux上的文件管理类命令都有哪些其常用的使用方法及其相关示例演示。 cp(copy) 复制,mv(move)移动或者更名,mkdir(创建目录,-p可以同时创建父目录),rm(删除目录,-r 可以递归操作,rmdir(删除空目录)删除文件或者目录,建议建立一个临时回收站,否则误删或者短时间内还需要的文件),touch,file,stat, …

    Linux干货 2016-12-25
  • N22-第三周作业

    1、列出当前系统上所有已经登录的用户的用户名,注意:同一个用户登录多次,则只显示一次即可。     首先用who命令查看所有已登录用户信息,然后用cut命令取出用户名,再用sort -u对用户名排序并删除重复的用户名      2、取出最后登录到当前系统的用户的相关信息。  &n…

    Linux干货 2016-09-05
  • N26-第四周作业

    1、复制/etc/skel目录为/home/tuser1,要求/home/tuser1及其内部文件的属组和其它用户均没有任何访问权限。 [root@localhost ~]# cp -rfp /etc/skel/ /home/tuser1[root@localhost ~]# chmod 700 /home/tuser1 2、编辑/etc/group文件,添…

    Linux干货 2017-02-25
  • N27_第十三周作业

    1、建立samba共享,共享目录为/data,要求:描述完整的过程 1)共享名为shared,工作组为magedu 2)添加组develop,添加用户gentoo,centos和Ubuntu,其中gentoo和centos以develop为附加组,Ubuntu不属于develop组,密码均为用户名 3)添加samba用户gentoo,centos和Ubunt…

    2017-11-20