单击此处编辑母版文本样式,第二级,第三级,单击此处编辑母版标题样式,第,1,页,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,运维体系建设介绍,及公司运维现状与展望,运维体系建设介绍,目录,运维部门的价值与挑战,运维部门的工作内容,运维工作体系建设之流程与制度(,Process,),运维工作体系建设之人员(,People,),运维工作体系建设之技术(,Technology,),运维工作的现状与展望,目录运维部门的价值与挑战,运维部门的定位,运维部门在公司的位置图例:,产,供,销 售后,对热线服务提供疑难技术支持,提升品牌形象,对产品优化研究,提升产品质量,服务中,心热线,RMA,技术支,持中心,备件中心,Tec,中心,实验室,平台为最终用户提供安全、可靠的支付等服务,丰台,菜市口,CMNET,望京,亦庄,根据产品方案,定制集成的系统方案,并保证按照规范平稳的运行系统,各业务线前端的产品和研发人员设计和生产软件模块,运维部门的定位运维部门在公司的位置图例:产,运维部门的价值,“,以流程为导向,以客户为中心,以技术为支点,提供低成本、高质量的,IT,服务,以满足业务快速发展的需要,”,全面管控企业范围内基础设施、信息资产等资源,实现前端业务的快速上线;售后用户的投诉等问题实现第一时间、一次性的完善解决,提升内外部客户的满意度,业务快速响应要求,业务连续性要求,业务安全性要求,成本预测与量化要求,对在线业务从系统层到业务层实现全面的监控,从被动处理转变为主动预防,制定,SLA,考核指标,提升故障的快速定位和解决,保障业务达到超出竞争对手的稳定运行率,运维服务实现标准流程化管理,统一计费单元,对服务进行计费管理,服务价值与业务发展相符。采用先进的技术,低成本对应业务转型,技术创造价值,横向从人员、流程、制度、技术手段等方面,纵向从网络层、主机层、存储层、数据层、业务层等方面,形成网状结构全面梳理安全问题,保障业务的机密、完整和可用性,运维部门的价值“以流程为导向,以客户为中心,以技术为支点,提,运维部门的价值,运维部门在公司的地位和作用,大背景:,产品的前期设计和开发在整个生命周期中只占,20%,左右,,80%,时间集中在运维和运营工作,随着各行各业的大规模信息化建设时代接近尾声,,IT,运维时代已经来临。,不同的公司,公司不同的发展阶段,运维部门地位和作用不同:,“,管理要效益,”,Consumer lead,“,规范期,”,Normative,梦网业务的,“,蛮荒期,”,Start up time,业务拓展为重,业务量考核,满足接入上量为原则,SP,为中心,缓解管理压力为重,重点解决系统稳定性、产品可用性、投诉处理,运营、运维管理为中心,效益考核为重,业务品牌建设,个性化服务细节,产品质量提升,用户为中心,移动梦网发展三个阶段,运维部门频繁上线及排障,多采用人海战术,规范性较差,“被动、无序”,产品的可用性及安全问题突显。,运维部门承担了产品质量的评价和部分管理职能,规范流程制度,向技术运维转型,致力于消除人为事故和安全隐患,运维部门从系统整体性角度出发,牵头持续优化产品质量和性能。,用户满意度成为考核指标,运维部门的价值运维部门在公司的地位和作用大背景:不同的公司,,网络和产品缺乏可用性等指标评价体系,系统优化缺乏依据;,运维人员在运维流程中缺乏服务评价指标体系,从而不能作为绩效考核的依据;,生产环境中单点设备较多,业务中断风险高;,老旧设备对新技术支持较差,资源分配不灵活;,监控、拨测等自动化运维工具缺乏,工作效率差、人力成本高;,CMDB,缺乏,生产环境中“僵尸节点”较多,影响业务更新,甚至带来平台重构的风险;,运维部门处于生产和销售的中间环节,对前后端各条业务线提供多种服务,规范的流程缺失,导致解决问题靠英雄和人情,责任定位不明确;,各种特批流程泛滥,运维人员的工作处于无序化,紧急且重要的业务需求得不到优先支持,影响内外部客户的满意度;,运维部门规模较小,人员紧张,分工粗泛,要求一人多能,一人管理多条业务线,导致人员专业性不强,人员数量和技能与实际要求差距较大,业务需求得不到快速良好的支持;,运维人员的职业规划和能力培养尚不完善,不规律的作息和巨大工作压力,导致了运维人员大量流失,工作分工不明确,经验固化随之薄弱。,运维部门的挑战,运维部门的困境和挑战,指标绩效,基础设施,流程制度,运维人员,网络和产品缺乏可用性等指标评价体系,系统优化缺乏依据;生产环,目录,运维部门的价值与挑战,运维部门的工作内容,运维工作体系建设之流程与制度(,Process,),运维工作体系建设之人员(,People,),运维工作体系建设之技术(,Technology,),运维工作的现状与展望,目录运维部门的价值与挑战,运维部门的工作内容,概念介绍,系统分层:,业务层,数据层,存储层,主机层,网络层,DB,层,*DB,层的运维目前不在,网络与系统运行部,运维部门的工作内容概念介绍系统分层:业务层数据层存储层主机,运维部门的工作内容,工作内容的分类,配置梳理,配置间关系梳理,日常巡检,全面监控,售前方案,系统调优,投诉处理,备份灾备,问题排查,故障处理,上线割接,商户接入,业务推广活动支撑,业务数据提取,告警处理,容量分析与报告,安全扫描,安全加固,安全工具更新,安全策略制定,配置管理,变更管理,事件管理,问题管理,容量管理,持续性管理,可用性管理,业务支撑,安全管理,X,网络、主机、存储、数据、业务,5,层,X,公司的业务线的数量,=,运维的工作量估算,1 2 3 4 5 6 7 8 9 10 11 12,13 14 15 16 17 18 19 20 21,应急演练,运维部门的工作内容工作内容的分类配置梳理配置间关系梳理日常巡,运维部门的工作内容,运维工作部署演进,第一步,第二步,第三步,运维工作多而杂,通过把复杂的运维工作从项目、系统分层、业务线进行三个维度的切分,使工作内容职责清晰,更易于落地执行;,对细分的工作内容进行梳理,固化工作经验,形成专业的操作手册,对于可以自动化实现的部分,做成运维工具,达到降本增效的目的,降低人为操作的误差;,将细分的专业化的工作模块化,由一线运维团队、二线支撑团队,和临时的虚拟项目组承担,或者考虑成本的要求,在安全性要求较低的工作上购买外包服务,网络系统模块,操作系统模块,数据库及应用模块,售后投诉模块,运维部门的工作内容运维工作部署演进第一步第二步第三步运维工作,目录,运维部门的价值与挑战,运维部门的工作内容,运维工作体系建设之流程与制度(,Process,),运维工作体系建设之人员(,People,),运维工作体系建设之技术(,Technology,),运维工作的现状与展望,目录运维部门的价值与挑战,运维工作体系建设之流程制度,流程制度分类,部门内部的流程制度,部门与外部的流程制度,部门内各团队间的工作流程,一线、二线团队之间的工作流程;,虚拟团队的工作流程;,服务产品外包的工作流程;,部门内的操作规范、安全制度,银联的安全规范、制度,移动的安全规范、制度,公司的安全基线规范,运维相关的编码的安全规范,售前技术支撑流程,上线流程,投诉处理流程,事件管理流程,问题管理流程,敏感数据提取流程,业务推广活动支撑流程,商户接入流程,服务目录,运维工作体系建设之流程制度流程制度分类部门内部的流程制度部门,运维工作体系建设之流程制度,流程制度举例,北京移动安全管理实施细则,V5,为了防止客户信息泄露等事故再次发生,重铸公司的品牌和信誉,北京移动公司网络部牵头,历时,1,年,各个部门均有参与,参与编写人员近百名,完成了公司内部的安全管理实施细则,共,35,个分类,全面梳理了公司内部各重要的流程中人因因素的部分,制定了操作和审计制度。,系统的安全制度体系方面我们公司比较缺失,运维工作体系建设之流程制度流程制度举例北京移动安全管理实施细,运维工作体系建设之流程制度,部门间服务接口,-,服务目录,概念:服务目录是管理内外部客户期望,使服务产品化、提升服务交付质量的重要工具,我们会按照和各业务线梳理和签订的服务目录,制定人力资源计划和各团队及各人的,KPI,服务项目,服务内容,运维工作体系建设之流程制度部门间服务接口-服务目录我们会按,运维工作体系建设之流程制度,服务目录举例,上线服务,服务项目,服务内容,运维工作体系建设之流程制度服务目录举例上线服务服务项目服务,目录,运维部门的价值与挑战,运维部门的工作内容,运维工作体系建设之流程与制度(,Process,),运维工作体系建设之人员(,People,),运维工作体系建设之技术(,Technology,),运维工作的现状与展望,目录运维部门的价值与挑战,运维工作体系建设之人员,研发团队和运维团队的关系举例:,A,组,B,组,项目,1,A,组研发,B,组运维,项目,2,B,组研发,A,组运维,保守期,运维人员由,研发人员轮岗,X,产品生命周期,例一:,NEC,强耦合,研发即运维,研发组,运维组,项目,1,研发组,运维组,项目,2,研发组,运维组,保守期,研发组留人,运维组留人,X,产品生命周期,例二:华为、联想、腾讯等,平衡型,研发和运维协同工作,产品部,维护部,项目,产品部门向维护,部门交维,保守期,维护,部门,X,产品生命周期,例一:北京移动,弱耦合,研发和运维分离,运维部门,研发组,1,研发组,2,产品,1,产品,n,例四:联动优势,无耦合,单点,运维工作体系建设之人员研发团队和运维团队的关系举例:A组项目,运维工作体系建设之人员,运维团队内的架构举例,产品,1,一线,运维,团队,产品,2,产品,n,二线应用运维团队,一线,运维,团队,一线,运维,团队,二线网络运维团队,二线主机运维团队,二线数据库运维团队,安全团队,北京移动,:,一线运维组:购买各产品原厂的维保;,二线应用运维组:系统负责人,A,、,B,角;,二线的网络、主机、数据库运维组购买神码的专业团队支撑所有产品;,安全组:移动员工专业团队,运营商、银行、证劵公司多采用,腾讯公司,:,一线运维组:按各产品划分,二线的应用运维组:支撑产品组合;,二线的网络、主机、数据库组:按照机房物理地点划分,安全组:管理所有产品,互联网公司多采用,研发团队,运维工作体系建设之人员运维团队内的架构举例产品1一线产品2产,运维工作体系建设之人员,根据公司的运维人员来源,人员架构如下:,商,户,组,运,行,组,主,机,组,网,络,组,维,护,组,技术,支撑组,一线团队,二线团队,技术支撑团队,负责商户接入,商户接入前的技术支撑;接入中的调试;接入后的问题解决,负责生产系统的一线运维,全面监控生产环境;告警、投诉和故障的及时响应;一线问题梳理;协助二线对系统优化,负责应用深度运维,各业务线一名专员在产品、研发阶段随工;产品设计阶段规划系统方案;做成维护手册前移至一线团队;各业务的系统排障;处理复杂投诉;负责系统质量指标制定和系统优化工作,负责自动化工具研发与新技术研究,研发监控、部署、商户调试等自动化运维工具;业界先进的运维技术研究并立项,负责网络、主机的深度运维,制定主机、网络方案,,,维护及优化生产环境物理设备,响应一线团队的告警、排障需求。,运维工作体系建设之人员根据公司的运维人员来源,人员架构如下:,运维工作体系建设之人员,运维人员的发展路径,以成本低、适应面广、服务优为视角,形成规模化的综合能力优势,锻造一支准确定位、快速反应的一线运维技术服务,团队,一线运维专才,1,以技术精、业务通为视角,锻造专家型技术支援团队,形成对各业务线的核心把控能力,向,IBM 800,技术热线或思科,CASE,团队水平靠拢,彰显公司技术售后服务品牌形象,TAC,专家,2,系统技术架构师,3,以灵活可靠,扩展性强为视角,形成各业务线的软件、硬件集成架构体系,具备主机、网络、,DB,及应用的综合技术能力,以及全方位的安全保障的能力,技术体系规划师,4,以技术前瞻为视角,形成清晰的技术体系规划蓝图,确保基础架构以最优