正则表达式常用元字符

正则表达式的使用需要借助于工具程序来实现,我们使用grep来演示正则表达式元字符的使用。

    grep使用方法    

        grep是一种文本搜索工具,根据用户指定的文本模式(搜索条件)对目标文件进行逐行搜索,显示能匹配到的行。

                正则表达式常用元字符

                使用grep在/etc/passwd文件中找到有”roo”关键字的行并显示了出来

         grep命令的语法:

            grep [OPTIONS] PATTERN [FILE…]  

                PATTERN:文本字符和正则表达式的元字符组合而成的匹配条件                 

                OPTOINS:此处只列举常用的选项

                    –color=auto:给关键字加上颜色

                        正则表达式常用元字符

                        可以在全局配置文件/etc/bashrc中定义命令别名grep=”grep –color=auto”,以使grep命令默认输出颜色

                        正则表达式常用元字符

                     -i:忽略大小写

                        正则表达式常用元字符

                    –v:显示没有被模式匹配的内容                

                        正则表达式常用元字符

                    -o:只显示被模式匹配的串本身

                           正则表达式常用元字符            

                    -n:显示行号

                        正则表达式常用元字符 

                    -A #:显示匹配字符的后面“#”行

                        正则表达式常用元字符

                        显示包含roo字符行的后面一行

                    -B #:显示匹配字符的前面“#”行

                        正则表达式常用元字符

                        显示包含ROO字符行的前面一行

                    -C #:显示匹配字符的前后面“#”行

                        正则表达式常用元字符

                        显示包含roo字符的前后各一行

                   -E:扩展正则表达式

正则表达式:Regular Expression, REGEXP    

     常用正则表达式分为两种

            1. 基本正则表达式(Basic REGEXP)

                grep

            2. 扩展正则表达式(Extended REGEXP)

                egrep、grep -E

    元字符:不表示其字面意义,而用于额外功能性描述

        基本正则表达式的元字符:

            字符匹配

                    . :匹配任意单个字符

                        正则表达式常用元字符

                         r..t:表示以r开头,中间包含两个任意字符并以t结尾的字符串

                    [ ]:匹配指定范围内的任意单个字符

                        正则表达式常用元字符

                        r[a-z]t:表示以r开头,中间包含一个任意小写字母并以t结尾的字符串

                        可以使用一些特殊符号还表示特定的值范围 

                             [[:digit:]]  :表示数字,相当于[0-9]

                             [[:lower:]]:表示小写字母,相当于[a-z]

                             [[:upper:]]:表示大写字母,相当于[A-Z]

                             [[:space:]]:表示任何会产生空白的字符,如空格键、tab键等

                             [[:punct:]]:表示标点符号

                             [[:alpha:]] :表示任何大小写字母,相当于[a-zA-Z]

                             [[:alnum:]]:表示任何大小写字母和数字,相当于[0-9a-zA-Z]

                    [^]:匹配指定范围外的任意单个字符                 

                        正则表达式常用元字符

                        r[^[:lower:]]t:表示以r开头,中间包含一位非小写字母并以t结尾的字符串                                 

                次数匹配:用于实现指定其前面的字所能够出现的次数                                       

                    *:任意长度,前面的字符可以出现任意次

                        正则表达式常用元字符

                         r*t:其中r*表示可以为空字符或一个连续r以上的字符;

                            如果需要至少两个r以上的字符串时,使用rrr*来表示

                                正则表达式常用元字符

                            同理需要至少三个r以上的字符串时,使用rrrr*来表示

                               正则表达式常用元字符

                    \?:匹配其前面的字符一次或0次,它前面的字符是可有可无的,其中\为转义字符

                            正则表达式常用元字符

                            rr\?t:表示以r开头,中间有一个或者为空字符并且以t结尾的字符串

                      \{m\}:m次,它前面的字符要出现m次

                            正则表达式常用元字符

                            r\{2\}:表示包含两个连续r的字符串

                      \{m,n\}:匹配其前面的字符至少m次,至多n次

                            正则表达式常用元字符

                            r\{2,4\}t:表示包含2至4个连续r,并且以t结尾的字符串

                        \{m,\}:最少匹配其前面的字符m次

                            正则表达式常用元字符

                            r\{5\}:表示最小出现5个连续的r并且以t结尾的字符串

                        \{0,n\}:最多匹配其前面的字符n次

                            正则表达式常用元字符

                            r\{0,5\}:表示最多出现5个连续的r并且为t结尾的字符串

                            正则表达式常用元字符

                            注:结果中出现了上面所示的行,是因为没有限定条件不严格造成的,可以定义字符串首部来得到精确结果

                                正则表达式常用元字符                               

                      .*:任意长度的任意字符

                        正则表达式常用元字符

                        r.*t:表示r与t之间为任意字符(包括空字符)的字符串     

            位置锚定:用于定义字符位置的元字符

                ^:锚定行首,此字符后面的任意内容出现在行首。

                    正则表达式常用元字符

                    查找以r开头t结尾的4个字符的字符串开头的行

                $:锚定行尾,此字符前面的任意内容出现在行尾

                    正则表达式常用元字符

                    查找以n结尾的行                  

                 ^$:空白行

                    正则表达式常用元字符                     

                \<或\b:其后面的任意字符必须作为单词首部出现

                    正则表达式常用元字符

                    正则表达式常用元字符

                    包含以op开头的单词的行

                \>或\b:其前面的任意字符必须作为单词尾部出现                

                    正则表达式常用元字符                

                    正则表达式常用元字符        

                    包含以ot结尾的单词的行        

                可以将两个符号结合使用,精确查找单词

                    正则表达式常用元字符

            分组:

                \( \):把内容分组,括号中的字符将被看作是一个整体进行操作

                    分组中的模式匹配到的内容,可由正则表达式引擎记忆在内存中,之后可被引用

                    例如:当我们想要查找一个文件中包含至少1个ab的行

                    新建一个文件eg

                    正则表达式常用元字符

                    正则表达式常用元字符

                    引用:

                         \#:引用第#个括号所匹配到的内容,而非模式本身

                        例如:

                            新建一个文件eg1,内容如下:

                            正则表达式常用元字符                           

                            使用分组得到以下结果

                             正则表达式常用元字符

                             下面使用引用来查找对应的行

                             正则表达式常用元字符

                            正则表达式常用元字符                    

                            表达式中的括号是有编号的,从最左边的左括号开始计算,编号从1开始,上面的表达式中有两个左括号,edu前面的为编号1,qa前面的为编号2;而与左括号相对应的右括号则是从里向外就近匹配,上面的表达式中编号为2的表达式为\(qa[[:digit:]]\),编号为1的表达式为\(edc[0-9]\{3\}\(qa[[:digit:]]\)\);     

                            \1表示如果在行中有匹配编号为1的表达式的结果,并且在本行再次出现此表达式的结果时,则此行被选中;如上图的查询结果中1号表达式的结果为”edc123qa7“,而后面又出现了一次此字符串,所以该行被选中;\2则引用2号表达式的结果进行匹配查找,2号表达式的结果为”qa7″,所以结果中列出了再次出现”qa7″字符串的行。

        扩展正则表达式:

                 字符匹配:与基本正则表达式相同

                    . :匹配任意单个字符

                    [ ]:匹配指定范围内的任意单个字符

                    [^]:匹配指定范围外的任意单个字符

                次数匹配:无需转义字符

                    *:任意长度,前面的字符可以出现任意次

                    ?:匹配前面的字符0或1次

                    +:至少1次= \{1,\}

                   {m}:精确匹配m次

                   {m,n}:至少m次,至多n次

                 锚定:与基本正则表达式相同,词首与词尾锚定依然需要转义

                 分组:与基本正则表达式相同,无需转义

                    ():无需转义

                     引用:\1,\2,\3 …

                 或者:

                    a|b:a或者b

                        正则表达式常用元字符 

                    使用扩展正则表达式完成上面的引用查询

                        正则表达式常用元字符

原创文章,作者:petmaster,如若转载,请注明出处:http://www.178linux.com/768

(0)
petmasterpetmaster
上一篇 2015-03-10 22:43
下一篇 2015-03-11 10:00

相关推荐

  • DNS和BIND配置(第一部分)

    一、知识整理 1、最初只有七个一级域名:Top Level Domain:tld:com、edu、mil、gov、net、org、int;     一级域名分三类:组织域、国家域、反向域。最多127级域名;全球有13个根节点服务器。 2、一次完整的查询请求经过的流程:client—hosts文件&#8212…

    Linux干货 2016-10-17
  • 为什么中国的网页设计那么烂?

    Nick Johnson,一个有12年经验的Web设计师在它的blog里写下了“Why is Chinese Web Design So Bad”,新浪,人人,百度,阿里巴巴,腾讯榜上有名。其中的观点相当的好,希望所有的中国人都读一下。我不全文翻译了,只是给大家看一些摘要。(保证不会像《环球时报》一样) —————————— 作者2005年的夏天来到中国,他…

    Linux干货 2016-07-11
  • 第一周博客作业

    前言:这几周的课程大部分开班前就掌握了的,这次学的细一点,顺便学一下markdown写博客、排版。内容有部分是前几期学员写的,觉得写得不错,就斗胆截取了,还有部分是自己写的,也有一些是百度到的内容。 目录 一、描述计算机的组成及其功能 二、linux发行版 三、linux哲学思想 四、常用命令 五、如何获取命令的帮助信息 六、linux发行版的基础目录名称命…

    Linux干货 2017-01-09
  • keepalived配置

    前两个配置做完实验没截图,后面的实验有图片。 keepalived的的单独设置 1.确保时间同步 ntpdate 10.1.0.1 2.保证/etc/hosts文件可以解析到 3.本机配置ssh-keygen -t rsa -P ''  ,然后ssh-copy-id -i .ssh/id_rsa.pub root@10.1.44…

    Linux干货 2016-11-11
  • linux多网卡绑定

    为了增加网络牢固性,linux服务器通过多块网卡来实现网卡冗余或链路聚合、负载均衡的技术。网卡绑定mode共有七种(0~6) bond0、bond1、bond2、bond3、bond4、bond5、bond6常用的有三种mode=0:平衡负载模式,有自动备援,但需要”Switch”支援及设定。mode=1:自动备援模式,其中一条线若断线,其他线路将会自动备援…

    系统运维 2016-06-23
  • CMDB内功心法,助我登上运维之巅

    很多70、80后甚至90后都在金庸、古龙、梁羽生先生等武林大家熏陶下成长的,这么多年过去了,我的武侠梦依然不曾散去。曾几何,梦想有一天练就一身绝学,搂着小师妹花前月下,仗剑走天涯,快意人生。可每次的酣睡美梦都被班主任大书板子给抽醒,在他们的鞭策之下,浑浑噩噩的成了一位IT骚年。我们都知道武功分为内功和招式,内功是气,而招式是形,以气御形。内功深厚,会让你的招…

    系统运维 2017-01-09