正则表达式及vim使用方法

正则表达式(正则表达式匹配的是文本内容中的字符串,通倍符匹配的是文件名)
REGEXP:由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符)
不表示字符字面意义,而表示控制或通配的功能
程序支持:grep,sed,awk,vim, less,nginx,varnish等
分两类:不同的命令支持不同的正则表达式
基本正则表达式:BRE
扩展正则表达式:ERE
grep -E, egrep
正则表达式引擎:
采用不同算法,检查处理正则表达式的软件模块
PCRE(Perl Compatible Regular Expressions)
元字符分类:字符匹配、匹配次数、位置锚定、分组
man 7 regex

字符匹配:
. 匹配任意单个字符   汉字也算一个字符  特例:.在中括号里面就代表.本身,不代表单个任意字符,.在中括号里面都不需要转义
[] 匹配指定范围内的任意单个字符  “或”的关系
[^] 匹配指定范围外的任意单个字符
[:alnum:] 字母和数字
[:alpha:] 代表任何英文大小写字符,亦即 A-Z, a-z
[:lower:] 小写字母 [:upper:] 大写字母
[:blank:] 空白字符(空格和制表符)
[:space:] 水平和垂直的空白字符(比[:blank:]包含的范围广)
[:cntrl:] 不可打印的控制字符(退格、删除、警铃…)
[:digit:] 十进制数字 [:xdigit:]十六进制数字
[:graph:] 可打印的非空白字符
[:print:] 可打印字符
[:punct:] 标点符号

例:
echo abc | grep a.c   输出显示abc
echo abbc | grep a..c 输出显示abbc
ls | grep …   显示的是任意三个字符的文件,grep默认是贪婪模式,从头三个三个匹配到尾,不够的就停下来了

echo a.b | grep -w “.\..”  显示的是a.b 原因是\.是转义的,\.就是代表.本身
echo abcdef | grep “a[abc]c”  意思有如果有aac或者abc或者acc均会显示出来整行,所以输出abcdef
如果echo abcdef | grep “a[xyz]c”则不显示
echo abcedf | grep “a[^xyz]c”意思是除了xyz以外任意一个字符与ac匹配,所以显示abcdef
ls | grep   ls命令的结果通过管道传给grep,grep将其作为字符串进行处理

匹配次数:用在要指定次数的字符后面,用于指定前面的字符要出现的次数
* 匹配*前面的字符任意次,包括0次
贪婪模式:尽可能长的匹配
.* 任意长度的任意字符
\? 匹配其前面的字符0或1次
\+ 匹配其前面的字符至少1次
\{n\} 匹配前面的字符n次
\{m,n\} 匹配前面的字符至少m次,至多n次
\{,n\} 匹配前面的字符至多n次
\{n,\} 匹配前面的字符至少n次


echo ab|grep “ax*b”   显示ab,x*的意思是x出现的次数为任意次,可以是0次
echo abb|grep “ax*b” 符合,后面的b相当于多余的
echo abccdd | grep “a[a-z]\?c”  意思是\?之前的[a-z]出现0次或1次,标红的是abc
grep “[a-z]\+”  意思是a-z小写字母至少出现一次   kjaakhd符合条件
grep “[a-z.]\+”例外:在中括号里面的.就是.本身,不代表单个任意字符,意思是a-z或.至少出现一次的都符合
centos7地址是:        inet 192.168.30.135  netmask 255.255.255.0  broadcast 192.168.30.255  将192.168.30.135取出来
ifconfig ens33 | grep -o “[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}”| head -n 1
或则ifconfig ens33|grep -o “[0-9.]\{7,\}”|head -n1  这种写法不太严谨
或者ifconfig ens33|grep -o “inet [0-9.]\+”|cut -d” ” -f2
centos6上是ifconfig eth0|grep -o “addr:[0-9.]\+”|cut -d”:” -f2
df | grep sd | grep -o “[0-9]\{1,3\}%”|grep -o “[0-9]\+”|sort -nr|head -n1   取分区利用率最大的

位置锚定:定位出现的位置
^行首锚定,用于模式的最左侧
$行尾锚定,用于模式的最右侧
^PATTERN$ 用于模式匹配整行
^$ 空行
^[[:space:]]*$ 空白行
\< 或 \b 词首锚定,用于单词模式的左侧    单词包括子母数字下划线属于一个单词,其他符号都不属于一个单词
\> 或 \b 词尾锚定;用于单词模式的右侧
\<PATTERN\> 匹配整个单词

例:
grep “^root” /etc/passwd 意思是要过滤出以root开头的行
grep “bash$” /etc/passwd 意思是要过滤出以bash结尾的行
grep -v “^[[:space:]]*$”  过滤空行,只显示非空的行
grep “\<root” /etc/passwd  过滤出以root为单词词首的行,只要root为单词词首就会显示,显示如下
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
例:
grep “root\>” /etc/passwd 过滤出以root为单词词尾的行,显示如下
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
例:
grep “\<root\>” /etc/passwd  过滤出只以root为单词的行,等价于grep -w “root” /etc/passwd

分组:\(\) 将一个或多个字符捆绑在一起,当作一个整体进行处理,如:
\(root\)\+
分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这
些变量的命名方式为: \1, \2, \3, …
\1 表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符
示例: \(string1\+\(string2\)*\)
\1 :string1\+\(string2\)*
\2 :string2
后向引用:引用前面的分组括号中的模式所匹配字符,而非模式本身
或者:\|
示例:a\|b: a或b C\|cat: C或cat \(C\|c\)at:Cat或cat

例:
grep “wang\{3\}”  过滤出g这个字母三次,不是wang这个字符串三次
grep “\(wang\)\{3\}” 过滤出wang这个字符串三次

echo wangwangwangxxxwangwangwang | grep “\(wang\)\{3\}.*\1”  \1意思是调用wang这个字符串三次
显示wangwangwangxxxwangwangwang

echo wangwangwangxxxmagemagewangwangwangmage | grep “\(wang\)\+.*\(mage\)\{1,\}\1.*\2”
等价于echo wangwangwangxxxmagemagewangwangwangmage | grep “\(wang\)\+.*\(mage\)\+\1.*\2”
显示wangwangwangxxxmagemagewangwangwangmage  意思是\1调用至少出现一次的wang,\2代表调用至少出现一次的mage

echo wangwangwangmagemagemagedjfshkfhwangwangwangmagemagemage | grep “\(wang\)\+.*\(mage\)\+.*\1.*\2.*”
显示wangwangwangmagemagemagedjfshkfhwangwangwangmagemagemage
注意:
echo rootxxrbbt | grep “\(r..t\).*\1”  rootxxrbbt不符合
原因是:\1代表(r..t)最终匹配的结果,(r..t)匹配到的是root,所以\1代表的是(r..t)最终匹配的结果root,而不是(r..t)
grep “^\(.*\):.*/\1$” /etc/passwd  过滤出passwd文件中以什么开头就以什么结尾的行,以:之前为头,以/为结尾
grep “^a\|^b.*” /etc/passwd 意思是以a开头或者以(b.*)开头
如果想表示以a开头或者以b开头,则grep “^\(a\|b\).*” /etc/passwd
grep “a\|bxy”      表示的是a或者bxy
grep “\(a\|b\)xy”   表示的是axy或者bxy
grep -o “[0-9]\+[.]” /etc/centos-release | grep -o “[0-9]\+”  取centos版本号
grep -o “[0-9]\+” /etc/centos-release | grep -o “[0-9]\+”  与上面的等价
grep -o “[0-9]\+” /etc/centos-release | head -n1          与上面的等价

egrep及扩展的正则表达式
egrep = grep -E
egrep [OPTIONS] PATTERN [FILE…]
扩展正则表达式的元字符:

字符匹配:
. 任意单个字符
[] 指定范围的字符
[^] 不在指定范围的字符

次数匹配:
*:匹配前面字符任意次
?: 0或1次
+:1次或多次
{m}:匹配m次
{m,n}:至少m,至多n次

位置锚定:
^ :行首
$ :行尾
\<, \b :语首
\>, \b :语尾

分组:
()
后向引用:\1, \2, …
或者:
a|b: a或b
C|cat: C或cat
(C|c)at:Cat或cat

vim简介
vi: Visual Interface,文本编辑器
文本:ASCII, Unicode
文本编辑种类:
行编辑器: sed
全屏编辑器:nano, vi
vim – Vi Improved
其他编辑器:
gedit 一个简单的图形编辑器
gvim 一个 Vim 编辑器的图形版本

打开文件
# vim  [OPTION]… FILE…
+#: 打开文件后,让光标处于第#行的行首,+默认行尾  vim +5 /etc/passwd
+/PATTERN :打开文件后,直接让光标处于第一个被 PATTERN 匹配到的行的行首
vim + /^rpc /etc/passwd   rpc为行首
–b file 二进制方式打开文件
–d file1 file2… 比较多个文件
-m file 只读打开文件
ex file 或 vim –e 直接进入ex模式
如果该文件存在,文件被打开并显示内容
如果该文件不存在,当编辑后第一次存盘时创建它

vim:一个模式编辑器
击键行为是依赖于 vim的 的“模式”
三种主要模式:
命令(Normal)模式:默认模式,移动光标,剪切/粘贴文本
插入(Insert)或编辑模式: 修改文本
扩展命令(extended command )模式: 保存,退出等
Esc键 退出当前模式
Esc键 Esc键 总是返回到命令模式

模式转换
命令模式 –> 插入模式
i: insert, 在光标所在处输入
I:在当前光标所在行的行首输入
a: append, 在光标所在处后面输入
A:在当前光标所在行的行尾输入
o: 在当前光标所在行的下方打开一个新行
O:在当前光标所在行的上方打开一个新行

插入模式 ——–> 命令模式
ESC
命令模式 ——–> 扩展命令模式
:
扩展命令模式 ——–> 命令模式
ESC

关闭文件
扩展模式:
:q  退出 (没有改过的情况下)
:q!  强制退出,丢弃做出的修改
:wq  保存退出
😡  保存退出
:w /data/f2  将修改完的另存为data目下的f2,如果原来有f2,想覆盖原f2内容则
:w! /data/f2
:r another   可以将另外的文件内容读到当前文件中,如:r f2 将f2的内容读到当前文件中
命令模式
ZZ: 保存退出(不建议用)
ZQ:不保存退出(不建议用)

扩展模式
按“:”进入Ex模式
创建一个命令提示符: 处于底部的屏幕左侧
命令:
w 写(存)磁盘文件
wq 写入并退出
q 退出
q!不存盘退出,即使更改都将丢失
r filename  读文件内容到当前文件中
w filename 将当前文件内容写入另一个文件
!command 执行命令
r!command 读入命令的输出
例:r!ls /boot/initramfs-0-rescue-adc241255b124d4095b8532193d518a1.img  支持tab键补全,直接将/boot/initramfs-0-rescue-adc241255b124d4095b8532193d518a1.img插入到当前内容

echo -e “\e[1;31m123\e[0m”  将123变成高亮红色
在vim插入模式下输入\e的方法:按住ctrl+v+[
在vim模式下输入带颜色的字的方法:在vim插入模式下插入\e[1;31mliu\e[0m    查看文件是liu是红色的,如果是很多的内容都要变颜色,就在内容头部打\e[1;31m 尾部打\e[0m

命令模式光标跳转
字符间跳转:
h: 左 l: 右 j: 下  k: 上
#COMMAND:跳转由#指定的个数的字符   例:3h 向左移三个字符
单词间跳转:
w:下一个单词的词首  3w  跳动三个单词
e:当前或下一单词的词尾
b:当前或前一个单词的词首
#COMMAND :由#指定一次跳转的单词数
当前页跳转:
H:页首 M:页中间行 L:页底

命令模式光标跳转
行首行尾跳转:
^: 跳转至行首的第一个非空白字符
0: 跳转至行首
$: 跳转至行尾
行间移动:
#G、扩展模式:# :跳转至由#指定行
G:最后一行
1G, gg: 第一行
句间移动:以.和空格算一句,空行也算一句
):下一句  (:上一句
段落间移动:空行算段落
}:下一段  {:上一段

命令模式翻屏操作
Ctrl+f: 向文件尾部翻一屏
Ctrl+b: 向文件首部翻一屏
Ctrl+d: 向文件尾部翻半屏
Ctrl+u:向文件首部翻半屏

命令模式操作
字符编辑:
x: 剪切光标处的字符
X:剪切光标前一个字符
#x: 剪切光标处起始的#个字符
p:在光标位置处后面粘贴
xp: 交换光标所在处的字符及其后面字符的位置
~:转换当前行大小写
J:删除当前行后的换行符(意思是将换行符隔开的两行换成一行)
替换命令(r, replace)
r: 替换光标所在处的字符
R:切换成REPLACE模式,替换多个字符

删除命令:
d: 删除命令,可结合光标跳转字符,实现范围删除
d$: 删除到行尾
d^:删除到非空行首
d0:删除光标处到行首,不包括光标处
dw: 2dw  删除光标处往后两个单词
de:
db:
#COMMAND
dd: 删除光标所在的行
#dd:多行删除
D:从当前光标位置一直删除到行尾,留空行,等同于d$

复制命令(y, yank):
y: 复制,行为相似于d命令
y$
y0
y^
ye
yw
yb
#COMMAND
yy:复制行
#yy: 复制多行
Y: 复制整行

粘贴命令(p, paste):
p:缓冲区存的如果为整行,则粘贴当前光标所在行的下方;否则,则粘贴
至当前光标所在处的后面
P:缓冲区存的如果为整行,则粘贴当前光标所在行的上方;否则,则粘贴
至当前光标所在处的前面

改变命令(c, change)
c: 修改后切换成插入模式
命令模式 –> 插入模式
c$ 从当前光标处删到当前行尾并进入插入模式
c^
c0
cb
ce
cw
#COMMAND
cc:删除当前行并输入新内容,相当于S
#cc:
C:删除当前光标到行尾,并切换成插入模式

100iwang [ESC] 粘贴“wang”100次
<start position><command><end position>
Command:
y 复制、d 删除、gU 变大写、gu 变小写
例如 0y$ 命令意味着:
0 → 先到行头
y → 从这里开始拷贝
$ → 拷贝到本行最后一个字符
ye 从当前位置拷贝到本单词的最后一个字符

扩展命令模式:地址定界
地址定界
:start_pos,end_pos
# 具体第#行,例如2表示第2行
#,# 从左侧#表示起始行,到右侧#表示结尾行
#,+# 从左侧#表示的起始行,加上右侧#表示的行数
:2,+3 表示2到5行
. 当前行
$ 整个内容的最后一行
.,$-1 当前行到倒数第二行
% 全文, 相当于1,$

/pat1/,/pat2/
从第一次被pat1模式匹配到的行开始,一直到第一次被pat2匹配到的行结束
例如:/^r/,/^b/d 意思是将以r开头的到以b开头的删除
#,/pat/
/pat/,$
使用方式:后跟一个编辑命令
d
y
w file: 将范围内的行另存至指定文件中
r file:在指定位置插入指定文件中的所有内容

扩展命令模式:查找
查找
/PATTERN:从当前光标所在处向文件尾部查找
?PATTERN:从当前光标所在处向文件首部查找
n:与命令同方向
N:与命令反方向

扩展命令模式:查找并替换
s: 在扩展模式下完成查找替换操作
格式:s/要查找的内容/替换为的内容/修饰符
要查找的内容:可使用模式
替换为的内容:不能使用模式,但可以使用\1, \2, …等后向引用符号;还可
以使用“&”引用前面查找时查找到的整个内容
如将全部haha替换为hahaer  :%s/\(haha\)/\1er/g   \1表示\(haha\)
修饰符:
i: 忽略大小写
g: 全局替换;默认情况下,每一行只替换第一次出现
gc:全局替换,每次替换前询问
查找替换中的分隔符/可替换为其它字符,例如
s@/etc@/var@g
s#/boot#/#i
例:1,10s/bash/csh/   意思是1-10行搜索bash并将bash替换为csh,默认情况下每一行只替换第一次出现
1,10s/bash/csh/g   意思是从1-10行全局搜索并将bash替换为csh
例;将第二行的/bin替换为/usr/bin   2s/\/bin/\/usr\/bin  需要将/转义下,即\/
例:%s/^UUID/#&/  意思是全文搜索,将UUID开头的行替换为#UUID。&的意思是前面搜索出来的所有字符

命令模式:撤消更改
u撤销最近的更改
#u撤销之前多次更改
U 撤消光标落在这行后所有此行的更改(前提是光标没有离开过此行)
按Ctrl + r重做最后的“撤消”更改(即回撤)
. 重复前一个操作
n.重复前一个操作n次

vim的寄存器
有26个命名寄存器和1个无命名寄存器,常存放不同的剪贴版内容,可以不同会话间
共享
寄存器名称a,b,…,z,格式:“寄存器 放在数字和命令之间
如:3″tyy 表示复制3行到t寄存器中
“tp 表示将t寄存器内容粘贴   默认贴到光标的下一行
未指定,将使用无命名寄存器
有10个数字寄存器,用0,1,…,9表示,0存放最近复制内容,1存放最近删除内容。
当新的文本变更和删除时,1转存到2,2转存到3,以此类推。数字寄存器不能在不
同会话间共享

编辑二进制文件(了解)
以二进制方式打开文件
vim –b binaryfile
扩展命令模式下,利用xxd命令转换为可读的十六进制
:%!xxd
编辑二进制文件
扩展命令模式下,利用xxd命令转换回二进制
:%!xxd –r
保存退出

可视化模式
允许选择的文本块
v 面向字符
V 面向行
ctrl-v  面向块
可视化键可用于与移动键结合使用:
w ) } 箭头等
突出显示的文字可被删除,复制,变更,过滤,搜索,替换等

多文件模式
vim FILE1 FILE2 FILE3 …
:next 下一个
:prev 前一个
:first 第一个
:last 最后一个
:wall 保存所有
:qall 退出所有
:wqall

使用多个“窗口”
多文件分割
vim -o|-O FILE1 FILE2 …
-o: 水平分割   Ctrl+w+jk键进行上下切换
-O: 垂直分割   Ctrl+w+hl键进行左右切换
在窗口间切换: Ctrl+w, Arrow
单文件窗口分割:
Ctrl+w,s: split, 水平分割
Ctrl+w,v: vertical, 垂直分割
ctrl+w,q:取消相邻窗口
ctrl+w,o:取消全部窗口
:wqall 退出

定制vim的工作特性
配置文件:永久有效
全局:/etc/vimrc
个人:~/.vimrc
扩展模式:当前vim进程有效
(1) 行号
显示:set number, 简写为set nu
取消显示:set nonumber, 简写为set nonu
(2) 忽略字符的大小写
启用:set ic
不忽略:set noic
(3) 自动缩进
启用:set ai
禁用:set noai
(4) 智能缩进
启用:smartindent 简写 set si
禁用:set nosi
(5) 高亮搜索
启用:set hlsearch
禁用:set nohlsearch
(6) 语法高亮
启用:syntax on
禁用:syntax off
(7) 显示Tab和换行符 ^I 和$显示
启用:set list
禁用:set nolist
(8)文件格式
启用windows格式:set fileformat=dos
启用unix格式:set fileformat=unix
简写: set ff=dos|unix
(9) 设置文本宽度
启用: set textwidth=65 (vim only)
禁用: set wrapmargin=15
(10) 设置光标所在行的标识线
启用:set cursorline,简写cul
禁用:set no cursorline
(11) 复制保留格式
启用: set paste
禁用: set nopaste

本文来自投稿,不代表Linux运维部落立场,如若转载,请注明出处:http://www.178linux.com/95444

发表评论

登录后才能评论

联系我们

400-080-6560

在线咨询:点击这里给我发消息

邮件:1823388528@qq.com

工作时间:周一至周五,9:30-18:30,节假日同时也值班