正则表达式及其用法

正则表达式及其用法

1.   什么是正则表达式

正则表达式是Global search REgular expression and Print out the line的缩写。是一类用字符所书写的模式,其中许多字符并不表示其字面意义,而是表达控制或通配等功能。

在Linux中,用正则表达式搜索文本的常用命令:

grep: 使用基本正则表达式匹配文本。

egrep:使用扩展正则表达式匹配文本,同: grep –E。

fgrep: 快速grep,不支持正则表达式,不识别元字符。

    语法格式:

      grep [option]… 'PATTERN' FILE…

2.   基本正则表达式

    (1)     字符匹配

(a)  .: 匹配任意单个字符。

(b)  []:匹配指定范围内的任意单个字符。

[0-9] 或[[:num:]]:匹配任意当个数字

[a-z]或[[:lower:]]:匹配任意单个小写字母

[A-Z]或[[:upper:]]:匹配任意一个大写字母

[[:space:]]:匹配空格或制表符

[[:punct:]]:匹配特殊字符

[[:alpha:]]:匹配单个任意字符

[[:alnum:]]:匹配单个字母或数字

(c)  [^]:匹配不包括指定范围内的任意单个字符。

   (2)     次数匹配

a*: 匹配它前面出现的字符任意次。

b\?: 匹配它前面的字符0次或1次。

c\{m\}: 匹配它前面出现的字符m次。

d\{m,n\}: 匹配它前面出现的字符至少m次,至多n次。

e\{m,\}: 匹配它前面出现的字符至少m次。

f\{,n\}: 匹配它前面出现的字符至多n次。

g.*: 匹配任意长度的任意字符.

  (3)     位置锚定

a^: 锚定句首,写在模式的最左面。

b$: 锚定句尾,写在模式的最右端。

c\<: 锚定词首,写在模式的最左面。

d\>: 锚定词尾,写在模式的最右面。

e.* : 空白行

  (4)     分组\(\)

       分组中的模式匹配到的内容,可由正则表达式引擎记忆在内存中,之后可被引用。

  (5)     引用 \#

引用第#个括号中匹配到的内容,而不是模式本身。

如:\(ab\?c\).*\1    abcmnabc 匹配

3.   扩展正则表达式

  (1)     字符匹配(同基本正则表达式)

(a)  .: 匹配任意单个字符。

(b)  []:匹配指定范围内的任意单个字符。

(c)  [^]:匹配不包括指定范围内的任意单个字符。

  (2)     次数匹配

a*: 匹配它前面出现的字符任意次。

b?: 匹配它前面的字符0次或1次。

c+: 匹配前面出现的字符至少一次。

c{m}: 匹配它前面出现的字符m次。

d{m,n}: 匹配它前面出现的字符至少m次,至多n次。

e{m,}: 匹配它前面出现的字符至少m次。

f{,n}: 匹配它前面出现的字符至多n次。

  (3)     位置锚定 (同基本正则表达式)

  (4)     分组()

  (5)     引用 \# (同基本正则表达式)

  (6)     或者  |

  如:a|b   表示 a或b

      ab|cd 表示 ab或cd

练习:

1.新建一个文本文件,假设有如下内容:

            He like his lover.

            He love his lover.

            He like his liker.

            He love his liker.

        找出其中最后一个单词是由此前某单词加r构成的行。

[root@centos7 ~]# cat ./liker.txt 

He like his lover.

He love his lover.

He like his liker.

He love his liker.

[root@centos7 ~]# grep '\<\(.*\)\>.*\1r' ./liker.txt 

He love his lover.

He like his liker.

[root@centos7 ~]# 

2.写一个模式,能匹配合理的ipv4地址;1.0.0.0-239.255.255.255

[root@centos7 ~]# cat ./ip.txt                       

249.1.0.1

229.2.1111.1

0.0.0.0

255.255.255.255

239.255.255.255

1.0.0.0

1000.0.0.0.0

1.1000.0.0

1.2.2000.0

1.2.3.4000

127.0.1.10

[root@centos7 ~]# grep -o -E '\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-3][0-9])((\.)([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}\>' ./ip.txt 

239.255.255.255

1.0.0.0

1.2.3.40

127.0.1.10

[root@centos7 ~]# 

原创文章,作者:浪迹天涯,如若转载,请注明出处:http://www.178linux.com/7969

(0)
浪迹天涯浪迹天涯
上一篇 2015-09-14 09:19
下一篇 2015-09-14 09:21

相关推荐

  • 网络管理基础-子网划分及网络配置练习

    1、某公司申请到一个C 类IP 地址,但要连接6 个的子公司,最大的一个子  公司有26 台计算机,每个子公司在一个网段中,则子网掩码应设为?  192.168.100.1 网络位192.168.100 192.168.100.00000000 C类掩码255.255.255.0 192.168.100. 000 00001  …

    Linux干货 2016-09-05
  • N22-℡浮生.若夢 ╮第八周作业

    1、请描述网桥、集线器、二层交换机、三层交换机、路由器的功能、使用场景与区别。 集线器:集线器的主要功能是对接收到的信号进行再生整形放大,以扩大网络的传输距离 网桥:是早期的两端口二层网络设备,用来连接不同网段。网桥的两个端口分别有一条独立的交换信道,       不是共享一条背板总线,可隔离冲突域…

    Linux干货 2016-11-28
  • 简明 Vim 练级攻略

    vim的学习曲线相当的大(参看各种文本编辑器的学习曲线),所以,如果你一开始看到的是一大堆VIM的命令分类,你一定会对这个编辑器失去兴趣的。下面的文章翻译自《Learn Vim Progressively》,我觉得这是给新手最好的VIM的升级教程了,没有列举所有的命令,只是列举了那些最有用的命令。非常不错。 ——————————正文开始—————————— …

    Linux干货 2015-04-04
  • Linux网络

    网络概念 OSI模型网络设备TCP/IPIP地址   什么是网络 资源共享的功能和优点数据和应用程序资源网络存储备份设备 常见的网络物理组件 网络应用程序Web 浏览器(Chrome、IE、Firefox等)即时消息(QQ、微信、钉钉等)电子邮件(Outlook、foxmail 等)协作(视频会议、VNC、Netmeeting、WebEx 等)we…

    Linux干货 2017-08-19
  • 马哥教育网络班21期-第六周课程练习

    请详细总结vim编辑器的使用并完成以下练习题1、复制/etc/rc.d/rc.sysinit文件至/tmp目录,将/tmp/rc.sysinit文件中的以至少一个空白字符开头的行的行首加#; #cp /etc/rc.d/rc.sysinit /tmp #vim /tmp/rc.sysinit :%s/^[[:space:]]/#…

    Linux干货 2016-08-15
  • (8.15-8.21)第2周博客作业

    1.linux文件管理命令 cat 功能:有从磁盘创建文件的功能(但不具备编辑功能),但主要功能还是2个或者以上文件的合并。 常配合使用参数: -n 或–number 由1 开始对所有输出的行数编号。-b 或–number-nonblank 和-n 相似,只不过对于空白行不编号。 使用方法: Cat –n diannaob1>d…

    Linux干货 2016-08-22