“我们”在数据中心搭帐篷
当下越来越多的人会在周末选择驱车前往近郊营地,充起地垫、备齐食物、扎上帐篷,伴着秋日享受户外时光。可就在上周六,两位省楚天云工程师却在数据中心里搭起了帐篷,这是怎么回事呢?
10月29日,省楚天云湖北省医保云项目组收到区疫情防控中心紧急通知,由于疫情防控需要,医保云主数据中心所在区域马上将进行封闭管理,暂停人员进出,封闭期暂定48小时,到期可能会延长。 马上派人进场?封闭几天不清楚,工程师在数据中心吃住存在诸多困难。 等到封闭期结束进场?封闭期内,一旦IT基础设施出现故障,可能无法得到及时响应处理。 湖北医保云承载了我省6000多万参保人的医保服务,和人民群众日常生活息息相关。医保云分布于多个数据中心,其中主中心就坐落在一个独立管理的生产区域,如果服务器硬件、云平台、网络、安全设备等IT基础设施出现故障没有得到及时处理,将会直接影响老百姓能否正常缴费、住院结算、药店买药,容不得半点闪失! 既要严格遵守疫情防控规定,又要保障医保云运行稳定,省楚天云云事业部副总经理和运维总监立即电话联系云平台工程师施辉和网络工程师付泽群,“情况紧急,长话短说,需要立即进场,不确定什么时候解封,有没有问题”?两位工程师一听情况,二话没说,立即动身,赶在封闭之前进了生产区域。 数据中心虽大,有数千平方的空间,却没有睡觉的地方,付泽群平时有户外活动的爱好,所以车上备有帐篷,而施辉则幸运的借到了一个行军床,这就出现了开头说的我们省楚天云的两个工程师在数据中心搭起了帐篷的一幕。 这次特殊的露营持续了4天,直到11月2日下午生产区域才恢复有限的进出。聊起这几天的经历,他俩说,比起平常除了晚上蚊子多了点儿,买饭需要趁早之外也没有什么特别的。 晚上蚊子有点多啊 明天买饭要趁早啊 是的,被封闭在生产区域的他们工作如常,这期间他们上架了一台云计算节点,物理部署HCSD扩容工具,为医保云IAAS平台升级做准备;还重新梳理了医保云软件供应商的专线网络策略,加固了内网安全。 这紧急响应的96小时坚守,只是省楚天云人默默为医保云保驾护航的一个缩影。如果大家仔细看上一张截图,就会发现在通知两位工程师紧急动身的对话之前,还有一条聊天记录:“云平台及存储巡检完成,无新增异常告警”。那是当天上午6点31分施辉发出的巡检汇报,确认了IAAS云平台和存储状态良好。这可不是某一天的临时工作,为了保障医保云的稳定运行,除了自动化监控体系之外,工程师们还会每天进行人工巡检,目的就是为了确保在每天医院、药店上班之前,医保云服务都是健康可靠的。 自从去年年底,湖北医保云项目全面上线以来,无论是元旦、春节,还是五一、中秋、国庆长假,群里的巡检汇报总是在每天早上六点多如约而至,这是一个省楚天云人的坚持,也是我们所有省楚天云人对客户、对湖北省6000万参保人的承诺——我们会100%的用心保障您每天所信赖的省楚天云服务。