我们都知道数据中心行业不同于其他行业,数据中心作为海量数据的关键载体,是信息化的核心场所,其复杂性、特殊性和重要性不言而喻。其实数据中心是科技行业跳动的心脏。
在数据中心做运维工程师容易,但是当好一名优秀的运维工程师不一定容易。不仅仅要主动涉猎设计等规范知识,还要有监理的良好心态。不想做设计的监理不是好运维。

作为一个优秀的运维,应参与数据中心场地基础设施的建设过程,以便将运维阶段的需求在规划、设计、建造、安装和调试等过程中得到充分的考虑,同时为后期做好运维工作打下坚实的基础。如果以前没接触过设计,前期参与规划设计过程中也会举步维艰。因为你不懂设计规范、验收规范、设备选型,而造成你的运维需求无法很好的表达。所以你必须保持一份做设计的心,初步涉猎数据中心相关规范、图集等。在设计与建造数据中心的时候,如果有运维人员介入,在整个数据中心设计和建设中是重要的一环。从运维的角度设计与建设数据中心,让数据中心交付使用之后更易于运维。
运维参与前期规划设计,可将运维阶段的需求在规划设计中得到充分考虑;可弥补设计师对系统运行管理知识的不足,提高设计质量,避免或消除设计缺欠。运维参与前期规划设计,可充分了解和掌握所维护系统的结构、可靠性薄弱环节、遗留问题、潜在风险,有助于提高运维质量、有根据地制定运维计划和切实可行的改造计划。

数据中心的全生命周期是一个谨慎和严谨的过程,需要所有参与数据中心建设的相关方共同完成,才能确保规划和设计的有效性、实用性等要求。一个优秀的运维管理者应提出运维要求,从运维经验、实际运维难度、提高运维可易性等方面对规划和设计过程进行配合。综述,运维不一定是设计师,但优秀的运维必定怀揣着一个设计师的梦想,并朝这方面努力。设计与运维的知识息息相关,通读规范才能避免数据中心运维过程中出现重大问题。不想当设计的运维,不是一个好运维。数据中心建设各个阶段的项目众多,项目管理是一个繁琐复杂系统工程。开展监理工作之前,首先一定要吃透项目的特点和难点,摸清各相关参建单位的情况。在这个基础上,确立自己的管理思路,哪些需重点管理,哪些需重点控制,哪些需重点协调,然后再确立监理机构的人员安排以及分工,以便于有针对性的开展监理工作。三 控: 质量控制、进度控制和成本控制;
一协调: 数据中心建设各个阶段的项目管理的协调。
建设监理制度是国际惯例,国家推行强制监理的一个重要目的是通过对监理企业法律责任的规定,促进建筑市场的规范,制约建设单位和施工单位的建设行为。其实运维管理也可以套用“三控、三管、一协调”。

质量控制:在数据中心运维过程中建立完善的质量管理体系,是保障以上数据中心场地基础设施运维趋于卓越的重要因素和手段。也就是PDCA。全面质量管理的思想基础和方法依据就是PDCA循环。PDCA循环的含义是将质量管理分为四个阶段,即Plan(计划)、Do(执行)、Check(检查)和 Act(处理)。目标控制:确定运维管理目标。制定目标时,应综合考虑数据中心所支持的应用的可用性要求、数据中心场地基础设施设施的等级、容量等因素。目标宜包括可用性目标、能效目标、可以用服务等级协议(SLA)的形式呈现。确定SLA并控制。成本控制:数据中心运行维护成本包含人员成本、能源成本、设备折旧或租金等。需制定运维计划、节能计划等成本管理规定等文件去控制数据中心运行成本。
安全管理:编制正式的数据中心生产环境的安全方针,设定严格的安全生产规范;并根据安全方针制定有效的、明确的安全计划,来教授和培训安全原则、危险识别、纠正缺陷和控制风险。并加强对于该部分规范的合规度的培训、考试和审核检查,以确保数据中心运维人员的人身安全。安全管理内容包含人员安全、员工职业健康、环境安全及信息安全等。
设施管理: 数据中心应建立完整及实时更新的资产数据库。数据库应包括所有关键基础设施设备的清单,还应记录设备设施的运行情况、事件情况、变更情况、维护保养频次等信息。运行管理: 数据中心应建立完整的运行维护管理制度和程序。明确物理范围及边界,并建立与周边设施的协调机制及责权界限。根据职责、工作范围和工作任务配备相应的人力、财务、物资和办公资源,以确保数据中心安全运行。日常维护工作是数据中心维护的根本,是确保设备安全运行的重要保证。主要通过建立一系列的管理制度来实现并保证日常维护工作的高效安全进行。运行管理内容包含:监控管理、值班管理、巡检管理、作业管理、故障通报、变更管理、容量管理、事件管理、问题管理、工程随工管理、应急管理、能效管理等。一协调: 为了明确管理责任,数据中心场地运维团队应将可能影响数据中心场地基础设施运维目标达成的外界因素整合成管理边界报告,制定完整的协调沟通机制及权责界限。这些因素包括但不限于:不归本部门负责,但可能对于本部门有重大影响的供电、供水、供暖、制冷、消防、安防、监控、运营商线路接入等系统。
数据中心的全生命周期来说,监理是保证数据中心建设施工质量的关键环节,那么运维是保证数据中心持续稳定运行的关键环节。所以监理与运维的作用是相辅相成的,作为一名优秀的运维管理者在建设过程中,可以从施工质量和日后运维方便性出发,指出施工过程的问题,及时纠正,方便日后运维和节省日后整改成本。
综述,一名优秀的运维工程师既要有设计的技术思维、也要有监理的质量把控管理能力。一名运维工程师可能不是专才,但需要各方面均有涉猎的通才。
----------------------------
往期精选文章导读:


-END-
「有用就扩散」
