当前位置: 亚洲城ca88 > 计算机网络 > 正文

创设软件系统来维护系统运作,你知道吗

时间:2020-03-11 20:02来源:计算机网络
现在很多小微企业,尤其是互联网创业公司,都选择直接用云,甚至没有专门设立运维岗位,所以设立了运维团队的公司是真正重视运维,重视业务稳定性、可靠性、安全性。所以,我

现在很多小微企业,尤其是互联网创业公司,都选择直接用云,甚至没有专门设立运维岗位,所以设立了运维团队的公司是真正重视运维,重视业务稳定性、可靠性、安全性 。所以,我们也非常好奇,每家设立了运维岗位的公司,其运维团队有多大呢?

引言:本文作者Ben Treynor Sloss,Google 运维团队的高级副总裁,SRE 名称的发明者,在这里提供了他对SRE 的定义。 
本文选自《SRE:Google运维解密》。

曾经被无数人吐槽的程序员猿,没想到如今已经绝地大翻身了!

运维派在公众号发起了一个名为的问卷调查,一天内收集到575份反馈,从数据可以看到,运维人数在10人以内的达到了67%,其中在2~5人规模的占了29%。

  大家都知道, 计算机软件系统离开人通常是无法自主运行的。那么,究竟应该如何去运维一个日趋复杂的大型分布式计算系统呢?雇佣系统管理员(sysadmin)运维复杂的计算机系统,是行业内一直以来的普遍做法。而Google 的解决之道是——SRE。 
  SRE 团队通过雇佣软件工程师,创造软件系统来维护系统运行以替代传统模型中的人工操作。 
  SRE 究竟是如何在Google 起源的呢? 其实我的答案非常简单:SRE 就是让软件工程师来设计一个新型运维团队的结果。当我在2003 年加入Google 的时候,我的任务就是领导一个由7 名软件工程师组成的“生产环境维护组”。当时,我的整个职业生涯都专注于软件工程,所以很自然,我按照自己最习惯的工作方式和管理方式来组建了这个团队。 
  时过境迁,当年的7 人团队已经成长为公司内部1000 余人的SRE 团队,但是SRE 团队的指导理念和工作方式还是基本保持了我最初的想法。 
  SRE 方法论中的主要模块,就是SRE 团队的构成。每个SRE 团队里基本上有两类工程师。 
  第一类,团队中 50%~60% 是标准的软件工程师,具体来讲,就是那些能够正常通过Google 软件工程师招聘流程的人。第二类,其他40%~50% 则是一些基本满足Google软件工程师标准(具备85%~99% 所要求的技能),但是同时具有一定程度的其他技术能力的工程师。 目前来看, UNIX 系统内部细节和1~3 层网络知识是Google 最看重的两类额外的技术能力。 
  除此之外, 所有的SRE 团队成员都必须非常愿意、也非常相信用软件工程方法可以解决复杂的运维问题。Google 一直密切关注这两类候选人在招聘通过之后在SRE 团队中的表现,但是到目前为止还没有发现他们在工作上和成绩上的显著差异。事实上,由于两类工程师技术背景互补,SRE 团队经常能够寻找到全新的、高效的解决问题的方法。 
按照这个标准来招聘和管理SRE 团队,我们很快发现SRE 团队成员具有如下特点: 
  (a) 对重复性、手工性的操作有天然的排斥感。 
  (b) 有足够的技术能力快速开发出软件系统以替代手工操作。 
  同时,SRE 团队和产品研发部门在学术和工作背景上非常相似。因此,从本质上来说,SRE 就是在用软件工程的思维和方法论完成以前由系统管理员团队手动完成的任务。这些SRE 倾向于通过设计、构建自动化工具来取代人工操作。 
  SRE 模型成功的关键在于对工程的关注。如果没有持续的、工程化的解决方案,运维的压力就会不断增加,团队也就需要更多的人来完成工作。传统的Ops 团队的大小基本与所服务的产品负载呈线性同步增长。如果一个产品非常成功,用户流量越来越大,就需要更多的团队成员来重复进行同样的事情。 
  为了避免这一点,负责运维这个服务的团队必须有足够的时间编程,否则他们就会被运维工作所淹没。因此,Google 为整个SRE 团队所做的所有传统运维工作设立了一个50% 的上限值。传统运维工作包括:工单处理、手工操作等。设立这样一个上限值确保了SRE 团队有足够的时间改进所维护的服务,将其变得更稳定和更易于维护。这个上限值并不是目标值。随着时间推移,SRE 团队应该倾向于将基本的运维工作全部消除,全力投入在研发任务上。因为整个系统应该可以自主运行,可以自动修复问题。我们的终极目标是推动整个系统趋向于无人化运行,而不仅仅是自动化某些人工流程。当然,在实际运行中,服务规模的不断扩张和新功能的上线已经让SRE 够忙了! 
  Google 的经验法则是,SRE 团队必须将50% 的精力花在真实的开发工作上。那么我们是如何确保每个团队都是这样做的呢?首先,我们必须不断地度量每个团队的工作时间分配。依靠这个数据,SRE 管理层会对在开发工作上投入时间不够的团队进行调整。通常,管理层会要求该团队将一些常见的运维工作交还给产品研发部门操作,或者从产品研发部门抽调人力参与团队轮值值班工作。此外,还可以停止该SRE 团队的一切新增运维工作。只有管理层主动维护每个SRE 团队的工作平衡,我们才能保障他们有足够的时间和精力去进行真正有创造性的、自主的研发工作,同时,这也保障了SRE 团队有足够的运维经验,从而让他们设计出切实解决问题的系统。 
  我们发现 Google SRE 模型在运维大规模复杂系统时有很多优势。由于SRE 在调整Google 系统的过程中常常直接参与开发、修改代码,SRE 文化在公司内部基本代表了一种快速、创新、拥抱变化的文化。实践证明,SRE 团队运行、维护、改进一个复杂系统所需要的成员数量与系统部署规模呈非线性增长。而运维同样的系统,用传统的系统管理员模型维护则需要更多数量的人。最后,SRE 模型不仅消除了传统模型中研发团队和运维团队的冲突焦点,反而促进了整个产品部门水平的整体提高。因为SRE 团队和研发团队之间的成员可以自由流动,整个产品部门的人员都有机会学习和参与大规模运维部署活动,从中获得平时难以获得的宝贵知识。普通的开发人员有多少机会能将自己的程序同时跑在100 万个CPU 的分布式系统上呢? 
  虽然SRE 模型带来了一些优势,但也存在一些问题。Google 面对的一个持久性的难题就是如何招聘合适的SRE。首先SRE 要和产品研发部门招聘传统的软件开发工程师竞争。 
  其次,由于SRE 要求同时具备多项技能,市场上具有相关从业背景和经验的人就更少了。由于SRE 模型也比较新,行业内关于如何建立和维护SRE 团队的相关信息并不多。最后,SRE 团队建立之后,由于SRE 模型中为了提高可靠性需要采取一些与常规做法违背的做法,所以需要强有力的管理层支持才能推行下去。例如:由于一个季度内的错误预算耗尽而停止发布新功能的决定,可能需要管理层的支持才能让产品研发部门重视起来。 
  本文选自《SRE:Google运维解密》,点此链接可在博文视点官网查看此书。 
                      计算机网络 1

我们来看看BATH的工资,宝宝表示羡慕嫉妒啊!

想及时获得更多精彩文章,可在微信中搜索“博文视点”或者扫描下方二维码并关注。
                       计算机网络 2

计算机网络 3

计算机网络 4

腾讯:一般T1-T4为大岗,每一级设立3级分档。应届生年薪在16W-20万,年终奖5W左右。员工主要集中在中段,尤其是 T2.3和 T3.1的人较多。腾讯标准薪资是14-15薪,但是通常能拿到16-20薪。

计算机网络 5

阿里巴巴:13k~18k*15。

计算机网络 6

百度:百度待遇非常高,大部分员工主要集中在T5、T6阶段,如果在里面混个6,7年的基本都能拿到50万年薪左右了。不过百度的加班文化也比较多,每天不搞到晚上10点别想走。很多人觉得薪水高,加加班其实也没什么,真是仁者见仁智者见智了。

华为:华为最早以通讯设备提供商横空出世,华为的薪酬一直具备竞争力,2006年的时候深圳应届本科毕业生月薪就能拿到5000左右。这两年更是风光无限,之前有人曝光了华为在南京校招的聘用通知书,年薪高达28.8万。

计算机网络 7

计算机网络 8

再看看比较有名的互联网、科技公司的应届毕业生的薪资水平:

计算机网络 9

看完了上面的这些,大家是不是有些小激动?

接下来我们看看大家最关心的运维工程师的薪水。

计算机网络 10

近些年,Linux人才越来越缺,待遇也越来越高。有数据显示,Linux运维工程师起薪多在8-10K,1-3年工作经验可达12-16K,3-5年工作经验可拿到年薪30-50W。

那么,什么样的运维人员才能进入进入那些大牛级别的公司,拿到高薪呢?

近期看到腾讯和顺丰的招聘如下:

计算机网络 11

计算机网络 12

再对比下之前阿里巴巴发布的招聘启示:

阿里健康-运维工程师岗位描述:1、负责系统稳定性工作;2、生产系统部署、上线;3、维护生产系统网络安全、稳定、可靠;4、维护生产系统数据备份;5、负责定期安全自检、自查。岗位要求:1、深入理解运维体系结构,精于容量规划、架构设计、性能优化;2、熟悉服务管理、单元部署、自动扩容等运维系统建设,对成本控制和效能提升有深刻的理解和实践3、熟悉故障、监控、限流、降级、预案、扩容工作原理;4、深入理解Linux、apache,tomcat,jboss,nginx系统原理,具备问题分析和快速处理能力;5、熟悉SHELL,PYTHON,PERL等脚本类编程工具,并有使用提升效率案例;6、熟悉java虚拟机,对java应用的部署及系统优化有一定的经验;7、熟悉Java,Php,C 等编程语言优先;8、熟悉自动化发布工具、熟悉虚docker技术优先;9、熟悉天猫共享技术体系架构优先;10、本科或以上学历,计算机或电信电子相关专业。

关于基本的学历、经验等问题我们暂且抛开不谈,单从岗位要求来看,这些职位要求应聘者熟悉整个运维系统的架构方式、熟悉运维系统的建设、了解一些基本的工作原理,对于运维基础知识要求相当之高。此外,某些职位还要求应聘者对于自动化运维有一定了解。我们可以断定,倘若应聘者对Linux仅仅是会用是不行的,必须对其原理进行深入认识才可以。

写在最后

从事运维领域的那些人执行的角色和任务因公司、行业、地区和基础设施类型而大不一样。今天看到O’Reilly Media的2017《运维薪水调查报告》,就几点想和大家分享一下。

这份报告对于650多名运维从业人员进行了调查,这些调查对象来自56个不同国家和美国的40个州,但是一半以上的调查对象来自美国,第二大调查群体(24%)来自西欧,所以并不能够代表中国的现状,以下仅供大家参考哈。

生活成本越高的地区,薪水越高

薪水往往与年龄和经验成正比,花时间学习实现日常脚本自动化的技巧提供了从事复杂、困难、要求很高的角色所需要的那种技能和经验,而这种角色对应的薪水更高。而年龄越大积累的经验越丰富,这反过来有利于经验这个因素,因而提高了薪水;

女性(8%)从事运维行业的比例相比男性(92%)要少得多,不过男性和女性之间的中位数薪水几乎一样;

公司规模越大,薪水越高;

运维行业的薪水并不随公司成立年限增长而随之增加。实际上,成立才短短2年至5年的公司付给运维人才的薪水最高;

规模更大的团队未必意味着薪水更高;

运维专业人员一周的工作时间比普通的朝九晚五办公族要长;

薪水似乎随着工作时间而增加,不过这可能表明调查对象是薪水很高的资深或重要员工;

你每周花在编写代码上的时间越多,薪水会涨得越高――不过每周编写代码的时间达到20多小时后,薪水不再上涨;

与我们在其他调查中看到的一样,花在会议上的时间充分表明了职责大小,开会时间较长的薪水较高。一周中绝大部分时间都在埋头编写代码的调查对象担任领导岗位的可能性较小,因而薪水往往较低;

通常而言,你的教育程度越高,往往薪水也越高。拥有高级学位的那些人可能获得了更吃香的专业技能;

只有11%的调查对象评述自己在找到新岗位的能力方面得分很低,64%对自己找到新岗位的能力挺有信心。这可能体现了运维技能需求旺盛的现实,表明了岗位和公司之间的移动比较流畅。

报告在最后提到:

计算机网络,收集的调查数据是观察的数据,而不是实验的数据。不能保证改变某个变量会引起你的薪水(立即或最终)上涨。某份特定工作的许多属性是相互关联的,仅仅专注于某个属性、尽可能地改善这个属性,也许不是让薪水上涨的最快方法。

所以,互联网是个变化非常之快的行业,很多运维工程师并没有意识到这一点,职位的要求随时在变,IT人必须持续且恒定的学习,才能保证不被飞快前进的行业抛下,进而升职加薪哦!

计算机网络 13

欢迎大家浏览我们的网站 www.itsmcn.com 浏览更多资讯

编辑:计算机网络 本文来源:创设软件系统来维护系统运作,你知道吗

关键词: 亚洲城ca88