优云软件老司机:如何让运维操作更轻松、高效

讲师介绍


庞辉富


•广通软件技术总监

•拥有10多年IT运维管理软件研发经验

•致力于自动化运维解决方案的研究和推广

•主导研发的产品广泛应用于海关、公安、能源等多个行业

技术发展给运维带来的挑战



1.jpg


当前的IT建设在这些新技术的演进下,我们看到的是呈现双态IT”特征。Gartner也提出双模IT理论,与现在谈的双态IT是异曲同工的,不再是一种单纯的形态,而是两种形态交集在一起。

一种是稳态也是我们经常说的核心业务,比如银行的核心业务、政府的核心业务等,业务系统一般以传统IOE或VCE架构设计,因为一旦出现故障对企业和社会导致非常大的损失,这些损失是很难承受得起的,所以其强调稳。

一种是敏态就是以“互联网+”或“+互联网”的概念把自己的渠道或服务开放出来,以便能更好的去创新和发展,敏态业务强调迭代和创新,可以允许适当的试错,但需要快速迭代。

这两种形态不是完全孤立的,而是随着企业自身和业界的发展互相进行转换,就算你不去变,在一定的情况下环境也会倒逼你做转变。所以我们的运维体系是需要能满足这两种形态的IT架构,既能够满足稳态的IT架构和管理方式,也能够适应互联网之下的新技术架构和敏捷管理模式,对运维提出不小的挑战。

    

2.jpg

那我们来总结一下前面说的新技术和业务形态给我们运维带来哪些挑战。


1)管理规模爆炸增长:物联网的设备规模我们先不说,因为其包括很多外场设备;有句话说未来每一个工业企业都是一个软件企业,意味着每个公司都需要依靠软件系统来支撑其业务,我们有一个客户,就一个信息中心部门,需要维护400多个业务系统,光服务器就有几千台,还不包括虚拟机,所以光靠人肉已经是伤不起了。

2)技术越来越复杂:随着云计算、互联网的发展,技术的沉淀越来越快,架构也变得越来越复杂,比如并行计算技术、分布式存储、大数据分析等等,以前我们一两台普通PC服务器能很好运行的系统,现在随着技术的复杂度增加,已经完全Out了,有个非官方的软件界摩尔定律说法,每18个月软件的运行速度就会慢1半(因为规模变大了,资源消耗更厉害)。也就是技术的复杂可能解决了业务的复杂度问题,但给运维带来的挑战却非常大。

3)随着云计算\容器化\分布式\集群化技术的发展,软件的变更发布会变得越来越频繁,比如亚马逊谈到,现在他们的系统都是微服务化,每天每个团队会发布上线30多次,所有团队1年有几千万次发布。虽然我们没有那么大的规模,但也说明现在已经不是半年或者1个月一个版本的时代了,现在至少要求每周\甚至每天都要有1个迭代发布。

4)现在生活节奏变快,现在我们每个人的耐心越来越有限,对服务中断的容忍度会越来越低。现在一个互联网服务如果中断超过半个小时,那是非常大的事件了,对于一些选择性多的服务来说,就是损失大量用户。

优云自动化解决方案



3.jpg

我们与CMDB结合要选一个自动化的平台。强调平台化,所有的能力转化为一个个原子操作,同时与其他运维系统有机集成。

  1. 它能与CMDB一起,打通整个运维的任督二脉

2.它可以不断丰富基础操作库

3.可以复用操作,通过可视化编排,实现个性化的运维场景

4.最终,它可以为不同的运维岗位,提供行业的最佳实践

4.jpg

相信每个运维工程师都会存有一些“私货”-运维脚本(无论是Python、Shell也或是批处理),在日常工作中便是靠这些脚本来实现运维的处理,比如软件安装、配置修改、清理磁盘空间、重启服务等等。这些脚本存在每个运维工程师的电脑里,没有经过有机的组织梳理,对环境的适应能力比较差,只能用于特定场景,无法很好的复用和共享。

为了让脚本最大限度发挥其生产力,我们需要一个库将团队内运维工程师的常用脚本统一管理起来,形成一个个运维的原力-能量水晶-我们可称其为“操作”,一个操作包括输入参数、处理脚本和输出参数。

将一个个操作集中管理起来,形成运维操作库,供编排使用。

5.jpg

6.jpg

操作只是实现某个运维目标的一个步骤,我们还需要一个通天云梯才能到达运维目标的终点。这个通天云梯便是编排编辑器,其通过可视化的方式,允许用户按运维场景将操作串接起来,通过操作的输入、输出让各操作共享数据,最终将一个个操作粘合成一架通往运维目标的云梯-编排。

为了让一个编排能适应更多环境,编排需要支持输入参数,将参数传递给操作,这样操作脚本便可根据参数兼容不同的环境。

编排编辑器可以长成这样:

7.jpg

总结一下,刚才我们重点介绍了在不同业务形态下的运维特征及技术发展给运维带来的挑战,优云的自动化解决方案如何让运维操作更轻松,高效,从三个层面展开说明。希望本文对大家在运维自动化操作上有所思考启发,后面有机会再跟大家继续分享其他相关运维实践。

本文内容整理来自【敏捷运维大讲堂】庞辉富老师的线上直播分享。

优云:全栈双态运维实践者,企业级运维专家

秉承devops的理念,从监控、到应用体验,到自动化持续交付

免费试用:https://www.uyun.cn

原创文章,作者:uyunops,如若转载,请注明出处:http://www.178linux.com/65927

(0)
上一篇 2017-01-09 10:03
下一篇 2017-01-09 13:30

相关推荐

  • 用户与用户组相关的配置文件与命令总结

    Linux 中用户与用户组相关的配置文件与命令总结 用户与用户组 UID、GID 名称解析与解析库(passwd、group、shadow、gshadow) 用户信息库/etc/passwd 用户密码信息/etc/shadow 组的信息库/etc/group 组的密码信息/etc/gshadow 用户管理命令 用户组管理命令 用户与用户组 Linux是一种多…

    2016-10-23
  • Memcached + MSM 实现Tomcat Session保持

    Memcached + MSM 实现Tomcat Session保持 tomcat memcached 前言 Memcached介绍 MSM介绍 实验拓扑 实验环境 实验步骤 安装配置Tomcat 安装配置Nginx负载均衡 安装配置Memcached + MSM 总结 前言 上篇文章我们实现了session sticky和session clus…

    2016-04-22
  • PHP高效率写法(详解原因)

    1.尽量静态化:    如果一个方法能被静态,那就声明它为静态的,速度可提高1/4,甚至我测试的时候,这个提高了近三倍。   当然了,这个测试方法需要在十万级以上次执行,效果才明显。   其实静态方法和非静态方法的效率主要区别在内存:静态方法在程序开始时生成内存,实例方法在程序运行中生成内存,所以静…

    Linux干货 2015-05-28
  • 精解局域网访问及共享(三)

    原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://jeffyyko.blog.51cto.com/28563/155109    上一节中的2种情况都是默认的简单共享,下面我们着重分析一下高级共享方式下的各种访问情况。毕竟这种方式用的很普遍,而且在权限…

    Linux干货 2015-03-25
  • 网络互联参考模型(详解)

    网络互联参考模型 1. 什么是协议 为了使数据可以在网络上从源传递到目的地,网络上所有设备需要“讲”相同的“语言” 描述网络通信中“语言”规范的一组规则就是协议 例如:两个人交谈,必须使用相同的语言,如果你说汉语,他说阿拉伯语…… 数据通信协议的定义 决定数据的格式和传输的一组规则或者一组惯例 2. 协议分层 网络通信的过程很复杂: 数据以电子信号的形式穿越…

    Linux干货 2015-05-07
  • EXT4文件系统的初步使用

    文件系统的类型多种多样,我们接触得比较多的当属Windows系统上的FAT32和NTFS。 而EXT文件系统(Extended filesystem)则是linux上常见的文件系统类型。 目前最新的版本是ext4,常见于CentOS6之中。 1.查看当前系统中有没有挂载使用中的EXT4文件系统,可以使用mount命令: 2.如何创建一个EXT4的文件系统(f…

    系统运维 2016-02-14

评论列表(1条)

  • sheng
    sheng 2017-04-13 16:23

    卧槽,优云都发到这里来了。。。