linux文本处理工具

linux文本处理工具

1.Linux 文件系统上的特殊权限: SUID     SGID   Sticky  

    进程的安全上下文:(1)任何一个可执行程序文件能不能启动为进程,取决发起者对程序文件是否拥有执行去权限

                                (2)启动为进程后,其属主为发起者,属组为发起者所属的组

                                (3)进程访文件的权限,取决于进程的发起者

                                            (a)  进程的发起者,同文件的属主:则应用文件属主权限
                                            (b)  进程的发起者,属于文件属组;则应用文件属组权限
                                            (c) 应用文件“其它”权限

SUID只对二进制可执行程序有效,设置在目录上无意义:chmod u+s file

SGID   对二进制文件生效,继承程序所属组的权限         chmod g+s

          作用在目录上,目录内新建文件的所属组自动继承目录所属组       (这个很实用)

sticky   粘滞位  作用在目录上,目录内的文件只有所有者能删除     chmod o+t

              当没有执行权限x时,特殊权限s,t会变成大写,特殊权限位可以用数字表示4,2,1,分别代表u,g,o

为防止用户误操作;还可以给文件创建特定属性:

        chattr +i  file            不能删除,改名,更改 ;               -A表示锁定时间戳,

         chattr +a                只能追加内容

         查看文件的特定属性:lasttr  file

ACL :Access Control List ,实现灵活的权限管理

            除了文件的所有者,所属组和其它人,可以对更多的用户设置权限

            ACL 生效顺序:所有者,自定义用户,自定义组,其他用户

通过实例来了解:   支持使用 – R   递归设置

setfacl -m u:wang:rwx     filename|dir            #自定义用户wang 拥有文件的rwx权限

setfacl -m g:group:rwx     filename|dir            #自定义组group有文件的rwx权限

setfacl  -x  u:username                                 #从文件acl表删除用户

           -k :                                                 # 清空默认的acl权限,增加的不会清空;完全清空使用 -b

getfacl       filenam                                      #查看文件的acl权限列表

               一旦有了ACL权限,中间组的权限不是原来的意思了,而是mask限高权限

                mask :r     限高线      意思是最高权限是r,不能超过
                   exam:   setfacl -m mask::rx file

文本的处理工具有:less   cat    head   tail    cut  grep    sort   uniq   cat   tac  rev

 cat  -E     :显示行结束符$                           head   -n#       指定获取前# 字节      taii     -n#

        -n    :对每行进行编号                                      -#       指定获取前#行                      -#   

        -A    :显示所有控制符                                     -c #     指定行数                               -c#

        -s    :压缩连续的空行成一行                                                                              -f    动态显示追加的内容

cut -d: -f2  filename              -d指定分隔符: -f指定抽取第几段,可以指定多段和连续

paste   f1  f2              #合并两文件同行号的列到一行

paste   -s   f1  f2         #也是合并意思,只是f1 内容一行显示,f2内容也一行显示,可以认为并排的两行文件

wc  -l      -w      -c       #分别统计行数,单词数,字节数;

sort   -r                       #执行反方向(由上至下)整理

         -n                      #执行按数字大小整理

uniq   -c                      #显示每行重复出现的次数

         -d                     #仅显示重复过的行

         -u                     #仅显示不曾重复的行

diff  f1  f2                   #比较两个文件之间的区别;命令的输出被保存在一种叫做“补丁”的文件

                                     使用 -u 选项来输出“统一的(unified )”diff 格式文件,最适用于补丁文件。

patch  -b                     #适用 -b 选项来自动备份改变了的文件;  diff和patch 就是用来打补丁的意思

文本处理三剑客

grep:文本过滤工具              grep, egrep, fgrep(不支持正则表达式)

sed :stream editor

awk :Linux 上的实现gawk ,文本报告生成器

 grep [OPTIONS] PATTERN [FILE…]          模式:由正则表达式字符及文本字符所编写的过滤条件

        -v    #显示不被模式匹配到的行               -i     #忽略字符大小写

        -n    #显示匹配的行号                           -c    #统计匹配的行号

        -o    #仅显示匹配到的字符串                  -q    #静默模式,什么都不输出

        -A -B -C  #    显示模式匹配到的后 ,前,上下各#行,对应单词意思after,befor,context

        -e    #实现多个选项间的逻辑or 关系        -E    #使用扩展正则表达式    -F   #使用fgerp

正则表达式:由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符)不表示字符                        字面意义,而表示控制或通配的功能

分为两类:  基本正则表达式:BRE                                                      扩展正则表达式:ERE

               和文件名通配有点区别,就个别不一样

                .      #匹配任意单个字符

                *      #匹配前面的字符任意次,贪婪模式:尽可能长的匹配

                .*   #任意长度的任意字符

               \{m,n\}   #匹配前面的字符至少m次,至多n次

               ^  行首锚定        $行尾锚定      ^$   空行

                 \b  词首锚定,用于单词模式的左侧     \ba   #a在词首

                 \b  词尾锚定;用于单词模式的右侧      a\b   #a在词尾 

                \<PATTERN\>    # 匹配整个单词  \是转义

分组: :\(\) 将 将 一个或多个字符捆绑在一起,当作一个整体进行处理,如:\(root\)\+

                  后 向引用:引用前面的分组括号中的模式所 匹配字符 , 而非模式本身

扩展正则表达式:

                *   #匹配前面字符任意次

                ?  #0次或1次

                +   #一次多多次

                {m,n} #至少m次,至多n次,也可分开

                C|cat: C 或cat        (C|c)at:Cat 或cat  

              

原创文章,作者:shewei,如若转载,请注明出处:http://www.178linux.com/70009

(0)
sheweishewei
上一篇 2017-02-25
下一篇 2017-02-25

相关推荐

  • N25期–第十六周作业

    1源码编译安装LNMP架构环境; 2、编写一个脚本完成以下功能: (1)、一键搭建LNMP源码编译环境; (2)、可通过在脚本后面跟上一些参数来自定义安装目录等其他选项。” 1、源码编译安装LNMP架构环境; 安装编译工具和库文件 1 yum -y install gcc gcc-c++ autoconf libjpeg libjpeg-devel libp…

    Linux干货 2017-05-08
  • Linux的终端类型

    一、了解终端   在早期的年代,主机不是很多,都是一系列的大型主机,简单来说就是用户很多,但主机很少,不可能做到人手一台,但可以在主机上连接一个分屏器,在分屏器上可以连接鼠标键盘以及显示器,这些东西是没有计算能力的,仅仅担任输入和输出的工作,运算和处理都是由主机来完成的。   简单来说终端是用户与主机交互,是必然用到的…

    Linux干货 2016-10-14
  • 系统基础之Btrfs文件系统详解

    btrfs文件系统:技术预览版(centos7) 描述: Btrfs(B-tree,Butter FS,Better fs),GPL授权,Orale,2007 写实复制特性(Cow)     cp –reflink (只能在btrfs文件系统中使用) 想取代ext系统系统, 支…

    Linux干货 2016-09-21
  • linux基础知识1

    Linux上的文件管理类命令都有哪些,其常用的使用方法及其相关示例演示。文件管理工具:cp,mv,rmcp命令:copy源文件:目标文件单源复制:cp [OPTION]… [-T] SOURCE DEST多源复制:cp [OPTION]… SOURCE… DIRECTORYcp [OPTION]… -t DIRECTORY SOURCE…单源复制:如果DES…

    2018-03-12
  • httpd配置

    httpd配置 修改监听的IP和端口(port) 持久连接 MPM DSO(Dynamic Shared Object) main server的文档页面路径 站点访问控制 定义站点主页面 定义路径别名 设定默认字符集 日志 基于用户的访问控制 虚拟主机 httpd状态页面 使用压缩模块mod_daflate优化速度 基于IP 为每个虚拟主机至少准备一个IP…

    Linux干货 2016-12-21
  • DNS and BIND 配置指南

    前言     说来接触Linux也有一年了,BIND是我曾经学习RH系Linux接触的第一个服务,对我有着莫大的意义,当初差点因为这个服务难以配置而放弃Linux,今天学完马哥的bind相关系列视频之后,写一篇DNS and BIND的基础到进阶。 一、DNS的基础知识 DNS是什么? DNS(Domain Name …

    Linux干货 2016-03-21