光大银行彭晓:数据中心的智能化运维探索
时间:2019-03-26 20:08

  数据中心智能化运维不只是利用机器代替人工,也不仅是大数据+自动化,而是利用人工智能技术,充分发掘各项数据资产价值,探索数据中心运营的创新。

  在当今全面数字化时代,“数据、标准、技术和场景”是数据中心智能化运维体系建设的核心要素,依托服务流程体系和IT连续性体系,利用大数据、人工智能等新技术,实现数据的集中管控。构建以监、管、控、防四大平台为支撑的新一代“服务化、数字化、平台化”的运维服务体系。

  数据治理标准:数据作为基础性战略资源,核心价值在于应用,在于其赋值和赋能作用。如何实现数据资源和数据交换共享是数据发挥价值的关键因素,也是数据标准的关键组成部分。

  数据生产标准:建立数据中心的运营管理标准,包括技术产品目录、非功能需求标准、操作维护规范,从数据生产源头来保障运营数据的标准化,提升数据质量。

  数据中心智能化运维不只是利用机器代替人工,也不仅是大数据+自动化,而是利用人工智能技术,充分发掘各项数据资产价值,探索数据中心运营的创新。

  我行持续探索智能化运维平台化能力建设,在整体架构上涵盖数据采集、数据处理、服务组件和展示,从数据范围、数据质量、数据应用和数据技术多个维度构建智能化运维数据支撑体系。

  数据采集:数据源按业务属性划分为配置数据、运行数据、行为数据。配置数据包括基础环监数据、硬件设备数据、基础软件数据及应用程序数据多个层级;运行数据包括基础设施、硬件设备及应用程序运行过程中产生的数据;行为数据包括生产运行过程中人员维护、自动化维护产生的各类数据。我们围绕数据中心的数字化运行态建设逐步推广采集范围。

  数据处理:由于数据的多源异构性,利用大数据技术建立一个运营数据仓库,实现数据中心的数字化运行态画像,建立各类智能化运维场景的能力。

  场景应用:应用是结合实际运营业务场景需求,延展数据中心运营管理的深度与广度。如我们正在探索建设的动态基线监控、海量告警压缩、业务容量预测等应用场景。

  光大银行在“智能化运维”的探索与实践中,以大数据平台为基础,逐步推动光大银行智能运维场景的落地实现,构建新一代监控平台、自动化平台、安全管控平台。

  运维大数据平台,依托大数据技术,实现网络流量、交易流量、日志等全面运营数据的实时采集;实现对数据中心的“数字化运行态”画像,建立数据中心级数据管控平台。

  统一监控平台,运用Hadoop、Spark等大数据技术在监控领域的应用,对海量生产运行数据的高效分析与处理,实现监控报警的大集中管理,提升监控管理的标准化、自动化能力。

  自动化运维平台,以知识共享、赋能理念为基础,建立围绕配置管理的自动化运维平台。实现监、管、控一体化,有效地推动运维工作的标准化、规范化,降低人工操作风险,提高运维服务的质量和效率。

  安全管控平台,以防御协同化、分析智能化、响应一体化、流程电子化的统一运营为理念和目标,聚合全行安全态势感知所需的各类信息安全监测、拦截、信息安全管控技术措施产生的运行数据及其他关联性数据,打破各类数据“孤立、无关联”的现状,结合外部安全威胁情报数据,驱动信息安全工作提升到新的阶段,将信息安全风险管理从被动变为主动。