职位描述
1、负责服务器稳定性治理、资源成本优化、交付效率提升相关工作,构建高效的服务器运维体系;
2、负责软硬件(服务器、操作系统)运行数据监控分析(性能、容量、事件等),构建服务器故障预测、诊断、定位、修复一体化方案;
3、负责服务器自动化运维系统的设计与开发工作,实现端到端的闭环自动化能力,包括测试、装机、验收、监控、故障处置等全模块自动化;
4、负责服务器软硬件安装、配置调试、故障处理等工作的执行指导和运维手册编写工作,能够快速准确的推动和协调内外部资源解决问题配合项目达成目标;
5、负责服务器运维技术调研和可行性验证工作,探索运维自动化和智能化的技术和方向。