您现在的位置: 主页 > 企业文化 >  正文
某金融单位一场由虚拟化存储引发的事件
发布日期:2022-03-05 08:24   来源:未知   阅读:

  某金融单位VMware虚拟化环境拥有1000台虚机,这些虚机运行在80个数据存储上。最近一段时间,由于业务上线比较多导致虚机数量快速增长,存储空间出现了紧张的情况,但是该单位并没有有效的虚拟化运维监控工具对存储空间的增长情况进行全面的监控。这就是一场即将发生的虚拟化存储事件的背景。

  一天下午,虚拟化管理员接到业务部门的电话,说某业务系统运行速度很慢,用户访问基本没有任何反应,于是管理员万分火急开始排查问题。

  首先排查运行业务系统的虚拟机CPU是否够用,发现CPU资源使用率不高;然后排查内存,内存资源使用也不高;查看系统磁盘使用情况也正常;再查看业务进程情况,也基本正常,管理员有点懵了。

  马上又开始查找运行虚机的宿主机资源情况,发现各项计算资源也是正常,直到排查虚机相关的数据存储时,发现此业务虚机存放数据的存储空间已经用到了99%,这也许就是业务系统变慢的原因。

  于是,该管理员做了业务虚机的迁移,更换了相关数据存储,业务虚机终于运行正常。用了30分钟的时间解决了问题,管理员长长的呼了口气。

  但是这个问题的后续工作可还没有结束,需要和各个业务部门、业务开发组等沟通迁移和这个数据存储有关系的业务虚机,以便清理存储空间,而这就不是一时半会可以解决的事情了。

  此次事件虽然解决问题的时间30分钟不算长,但是对于时效性、连续性、关联性很强的金融单位来说,这已经算大的事故了,亟待寻求高效的虚拟化运维管理之道。结合业务与运维需求,以及对相关平台对比分析后,该金融单位选择安装部署了富通云腾VMware管家。

  VMware管家不仅能够详细监控数据存储的空间使用情况,如下图(非真实客户环境截图):

  同时,VMware管家还可以针对每块数据存储的使用情况进行详尽的监控,如下图(非真实客户环境截图):

  根据该金融单位虚拟化管理员的要求,VMware管家每天早上8点会定时给他发送所有数据存储的空间使用情况的报表,方便其每天对数据存储的使用情况进行预估,如下图(非真实客户环境截图):

  综上,VMware管家不仅能够对数据存储整体的空间使用情况进行实时监控,还可以对每块数据存储的空间使用情况进行详尽的监控,在帮助虚拟化管理员及时了解存储的空间使用率的同时,减少业务运营发生风险的可能性。返回搜狐,查看更多东方三项目入选2021年度海南省重大科技专项2022年浙江注会报名时间:4月6日-29日