服务器运行维护流程 1. 日常服务器运维部自我巡检: (1) 每日早8:00通过cacti监控软件查看所有服务器总流量、单兵流量、CPU和内存使用情况、硬盘使用情况等运行是否正常。例如以下为硬盘根目录的使用情况: (2) 对异常单兵服务器进行查看CPU、内存占用率等进行详细分析和排查。 (3) 对异常单兵进行所有服务进程检查,看是否正常,并进行排查。 (4) 查看使用用户,是否有异常用户登录。如有异常用户登录,查看该用户下的文件,是否有木马、病毒或有威胁的文件,进行删除和维护。 (5) 查看服务器系统是否需要打新的补丁,如需升级,进行升级。 (6) 在服务器和本机上同时对网页的打开速度进行测试,登陆到系统上查看系统页面中程序运行是否正常。 (7) 对公司五大系统接口进行打开测试查看是否正常。 测试内容: 集采平台打开测试; 便利店系统打开测试; 云仓储接口打开测试; 云管理接口打开测试; 云支付买买金接口打开测试。 2. 周和月服务器运维部自我巡检: 通过查看监控周流量和月流量、服务器各项硬件使用情况查看等分析 (1) 在管理工具中查看事件查看器中的应用、安全、系统、日志中的工作状态,是否有异常情况,如有进行清除和修复,每星期进行一次清除工作。 (2) 每两个星期检查一次操作系统日志。 (3) 每星期定时对服务器的网站程序文件进行备份。备份原则上采用数据库完全备份加日志备份策略、web前端增量备份; ➢ 备份数据存储策略:本机、异机、2个级别。 ➢ 重要更新时间点前后必须做数据库备份或日志备份,特别是在做数据库表更新、应用程序更新。 ➢ 每天检查所有数据库备份操作是否正确完成、异地传输是否正常完成,并填写检查表。 ➢ 在异地备份数据准确存储后,可以将超过2周以上的异机备份数据通过自动删除脚本进行删除,以便腾出存储空间。 (4) 为保证服务器系统正常运行,每星期对系统盘C盘进行垃圾清理和维护。 (5) 在数据库服务器、关键应用服务器上,只能有数据库DBA人员的帐号,开发人员需要介入时,填写开发人员使用数据库申请单向上级申请。 3. 运维部自我巡检周和月工作总结: 对一个月内服务器系统的运行情况进行汇总,把解决的问题及不能解决的问题归纳总结并向上级领导提交,通过会议形式决定解决办法和执行方式来解决所面临的问题。 4. 机房协助巡检: 机房每周会对机柜使用情况、流量峰值情况、机柜温度、湿度等进行巡检,每周发送到公司运维部,进行评估和查看。例如: 5、服务器硬件定期更换和清理: 针对所有服务器硬件清洁期限和更换如下: ➢ 每年进行服务器灰尘开盖清理,通过机房人员协助; ➢ 对于存储硬盘,期限为两年更换一次,保证硬盘的正常使用; ➢ 电源模块测试,若有欠压和损坏的进行彻底更换。 本文来源:https://www.wddqw.com/doc/ae995cbcf342336c1eb91a37f111f18582d00cd1.html