随着信息化到数字化的发展,网络智能化,从物理网络、物理机到虚拟网络、虚拟服务器,从单一专线、互联网,到多网络接入、混合云。网络流量大、业务多、部门多、厂家多、技术多,访问关系复杂。
网络和业务的复杂性、以及实际生产管理对网络的依赖度越来越高,网络管理运维工作越来越复杂,来自多个业务、多个系统的问题,都要由网络运维,都需要由网络运维部门/人员进行处理。
网络性能保障面临的问题
- 网络体验差问题
业务要求高,对于时好时慢、偶发性网络异常、故障,不良的体验将导致用户对公司服务的满意度低、投诉、甚至业务损失,传统网管不能掌握传输质量。
- 故障处理难问题
一旦有严重的故障,需要一手数据,跨部门、多厂商、多系统数据,快速分析查明原因,快速恢复业务,减少损失,传统网管找不到这些数据。
- 关键业务保障难问题
在重要保障时期,要对关键业务进行性能保障,不清楚业务运行状况,难以进行有效及时的响应处理、难以主动有针对性的进行优化。
建设需求
- 发现网络异常,提升用户体验。
- 快速定位故障,降低重大损失。
- 分析业务流量,保障重大业务。
解决方案
建立网络模型
从网络运维管理视角,网络和业务的模型,是从组织机构、组网拓扑的角度,反映网络整体结构;从地区、部门、链路的角度,反映网络各部分之间的连接关系和访问关系;从用户、服务器、应用(端口)的角度,反映具体对象在端对端的通信访问关系、通信数据;从业务系统的角度,反映网络与业务系统、与业务部门之间的关系。
为了更好帮助网络运维管理部门实现全面的网络流量监控、故障分析,需要基于网络模型进行配置:
- 用户、服务器、应用,对应的组织结构、网络拓扑关系;
- 链路、站点、网段、区间,对应的组织结构、网络拓扑关系;
- 业务系统:关键业务、一般业务、关键指标;
- 异常流量、异常质量。
发现网络异常,提升用户体验
流量分析设备通过评估分析网络运行性能,诊断整体网络异常。
- 从据中心、接入网、广域网三个网络类型,快速找到需要进行分析的主体对象。
- 从部门、区域、业务分组,进行区域性网络异常分析。
- 针对具体的对象分析,来判断分析网络异常情况。具体对象包括用户、应用、服务器、端口、地区、站点、链路。
- 通过回溯告警、行为分析数据,分析异常突发流量、异常访问行为。
- 通过对流量和传输指标,进行统计分析、趋势变化分析,判断整体流量异常,包括是否有流量、流量突发突降变化、TCP主要传输指标统计。
分析业务流量,保障重大业务
流量分析设备分析业务系统运行性能,从网络部门视角掌握业务运行情况、解决业务故障。
- 根据重大保障要求,提前对关键业务系统进行访问关系梳理、指标监控、性能评估,及时优化存在的异常,避免潜在的故障。
- 在重大保障期间,对关键指标进行监控,及时发现异常,及时进行处置。