当前人工智能正处在飞速发展阶段,已在多领域取得实质性突破。对通信领域而言,随着通信网络的复杂化和通信业务的多样化,网络运营正面临更大的挑战和压力,将人工智能引入通信网络成为网络智能化的必要步骤。围绕网络运营重要环节之一的网络运维优化工作,探讨人工智能在其中的应用需求、方向和面临的挑战,通过具体应用场景介绍人工智能如何为网络运营降本增效、提升业务质量。
引言
近年来,随着大数据、计算方法、运算存储能力的飞速发展,人工智能技术在历经60余年的沉浮之后迎来新的发展拐点,成为未来一个时期全球最重要的科学技术,为各类产业提供重要的技术支撑。当前人工智能技术在图像、语音、文本处理等领域已取得实质性的进展,人工智能颠覆性的革命成果为各行各业带来巨大变革,并快速、全面地渗透到人类活动的各个领域。
随着信息通信技术的快速发展,ICT产业融合逐步深入,网络进行重构转型,众多新技术在不断演进升级,现有的电信网络较之以往更为复杂化、异构化、动态化,电信业务也跟随时代的发展和用户的需求呈现多元化和个性化,这给网络运营带来更大的压力和挑战。将人工智能引入电信网络是网络智能化的一大趋势,这样可以有效提高网络运营效率、降低运营成本、提升业务质量。本文将对人工智能技术在电信网络运营过程重要环节——网络运维优化中的应用进行相关探讨。
1
人工智能在网络运维优化中的应用需求
人工智能(AI——ArtificialIntelligence)是一门融合了计算机科学、统计学、脑神经学和社会科学的前沿综合性学科。它的目标是希望计算机拥有像人一样的智力能力,可以替代人类实现识别、认知、分类和决策等多种功能。人工智能从1956年正式提出开始已经发展了60余年,期间经历了三起两落的兴衰过程,各类算法结合应用也在不断地发展和升级。机器学习作为人工智能的重要分支和方法,在诸多领域表现出色。任何通过数据训练的学习算法的相关研究都属于机器学习,使用学习算法从大量的数据中解析得到有用的信息并从中学习,然后对之后真实世界中会发生的事情进行预测或做出判断。机器学习需要海量的数据来进行训练,并从这些数据中得到有用的信息,然后反馈到真实世界的用户中,具体的算法包括很多已经发展多年的技术,如线性回归、K均值、决策树、随机森林、聚类、SVM、人工神经网络等。机器学习三要素为数据、算法、算力,近年来随着大数据和运算能力的高速发展,人工智能呈现爆炸式发展,深度学习技术从众多机器学习算法中脱颖而出,在图像识别、语音识别等方面取得巨大进展和突破,对人工智能在各行业领域进行落地应用打下坚实基础。
着眼于通信行业,由于移动互联网、智能终端等技术的快速发展,数据呈现爆发式增长,电信运营商在大数据发展中扮演重要角色。运营商处理的海量数据涵盖了用户基本信息、通话数据、上网数据、网络运行数据等多方面,人工智能技术的引入提升了通信大数据的分析、挖掘速度和管理效率,使网络智能化变得更为现实,给网络运营成本、效率和管理带来新的突破方向。
网络智能化是未来网络的必然发展趋势,运维优化作为电信网络运营的重要环节,对人工智能技术的引入也有着强烈的需求。随着2G、3G、4G以及即将到来的5G等多种无线接入技术的应用,运营商网络变得越来越复杂,用户网络行为和网络性能也比以往更动态化而难以预测。与此同时,由于移动通信业务的多样化和个性化,网络的运营优化焦点也逐渐从网络性能转变为用户体验。
传统的运维优化生产模式是以工程师的经验为准则,借助人工路测、网络KPI分析、告警信息等手段处理网络问题并进行优化调整,其缺点伴随着网络发展越来越明显:生产效率低、处理周期长、优化效果存在片面性,故传统的网络生产模式很可能无法再满足运营商的未来需求,需考虑在网络运维优化中引入人工智能技术,人工智能可根据网络承载、网络流量、用户行为和其他参数来不断优化网络配置,进行实时主动式的网络自我校正和优化,同时通过人工智能为复杂的无线网络和用户需求提供强大的决策能力,从而驱动网络的智能化转型。
2
人工智能在网络运维优化中的应用
人工智能技术有着自身独特的优势,能解决很多传统方法无法解决的难题。人工智能技术主要具备能力有:
a)超强的学习能力,能对大量的输入信息进行分析和学习,并通过不断的学习加强模型,掌握专家经验,提升解决问题的准确性。
b)良好的全面性,能处理和发掘人类工作不容易注意的问题和不确定的信息。
c)效率高,能模拟人类方式进行大量重复的工作,提升生产效率。
为了最大限度地降低网络运维成本,最大程度地提升网络优化工作效率,需利用人工智能技术的良好学习能力、分析处理能力、跨域协同能力和资源利用效率,发展网络智能化、自动化(见图1)。
▲ 图1人工智能在网络运维优化中的应用模式
2.1智能运维
运营商会部署各级网管系统/平台,对网络和业务运行情况进行监控和保障。现网中如果网络设备出现故障和告警,一般由运维工程师根据历史经验和理论知识归纳总结出来的相关规则进行处理。传统运维方式存在处理效率低、实时性不强、运维成本高、问题前瞻性不够等缺点。为了解决上述问题,可以人工智能技术为基础,结合运维工程师的经验,构建一种智能化、自动化的故障处理监控系统/功能模块,能够在通信网络中实现对故障告警的全局监控、处理,实时采集告警和网管数据并关联分析处理,进行灵活过滤、匹配、分类、溯源,对网络故障快速诊断,配合相应的通信业务模型和网络拓扑结构实现故障的精准定位和根因分析,并通过历史数据不断自学习实现故障预测,提升处理效率和准确性。
2.2智能优化
网络优化的主要作用是保障网络的全覆盖及网络资源的合理分配,提升网络质量,保证用户体验,所以运营商在网络优化工作中投入了大量人力物力。网络优化涉及多个方面,如无线覆盖优化、干扰优化、容量优化、端到端优化等,传统网优工作一般依靠路测、系统统计数据分析、投诉信息等手段采集相关数据信息,再结合网优工程师的专家经验进行问题诊断和优化调整。在网络复杂化和业务多样化的趋势下,传统网优工作模式显得被动,处理问题片面化,难以保证优化质量,而且生产效率低,在网络动态变化的情况下难以保证实时性。采用人工智能技术可对网优大数据进行训练,并将大量的专家经验模型化,构建智能优化引擎,模拟专家思维驱动网络主动实时做出决策,进行主动式优化和调整,使网络处于最佳工作状态。
人工智能在网络运维优化中的应用需要有高质量的数据做基础,需要利用合适的人工智能算法在相关的方向或场景进行实践。高质量的数据要通过整合网络相关运行、测试和信息数据来获取,数据源包括路测数据、MR数据、性能数据、配置数据、工参数据、信令采集数据、告警数据、用户信息数据、投诉数据、互联网数据等等。根据不同应用场景需求和特征,选择并关联有效的数据源,结合运维网优工程师的优秀工作经验,匹配合适的人工智能算法设计特征工程、训练及建立模型。
3
人工智能在网络运维优化中的应用场景
利用人工智能技术时需考虑实际网络运维优化工作的生产流程和模式,根据应用场景需求选择合适的人工智能算法,对相关的数据进行清洗、标注、训练,建立可靠有效的系统模型,来实现人工智能在网络运维优化中的应用。下面给出几个应用场景示例进行参考。
3.1智能故障溯源
网络故障分析和溯源是运维的重点工作,网络发生故障的现象和原因有很多,会产生很多不同类型的告警信息,从告警中快速准确地判断故障信息是我们的目标和要求。在设计智能分析系统时,可考虑从海量告警信息中结合网络拓扑、网络配置、KPI、历史告警故障处理经验等信息提取共性特征,融合已有的历史处理故障经验对提取数据进行训练形成专家诊断规则库,对新产生的告警信息匹配规则进行诊断,给出故障原因和处理方法,在处理故障后结合网络运行状态对专家诊断规则库进行反馈优化,具体流程如图2所示。
▲图2基于人工智能的网络故障溯源流程
3.2无线覆盖智能优化
无线覆盖是移动通信网络质量的基础,基站站点的位置选择在现实中不会像仿真模型中一样完美,受到建设投资、地形、传播路径动态变化、网络负荷等因素的影响,移动网络总会存在弱覆盖、越区覆盖、干扰、容量等问题,这些会直接影响用户业务体验,需要通过优化不断调整,以满足用户对网络质量的要求。无线环境复杂多变,影响覆盖质量的因素甚多且不确定性较强,我们可以结合多维无线覆盖相关历史数据(MR、路测、工参、无线KPI、参数配置等),利用深度学习等人工智能技术对数据训练、调参,寻找影响无线网络质量的关键因素,以此来构建智能优化引擎。优化引擎能结合现网运行状态准确实时给出优化调整建议和决策,如天线下倾角和方位角调整、性能参数优化、邻区配置调整等,并进行相关自动化或者人为处理,保证网络质量处于良好水平,优化系统模型如图3所示。
▲图3基于神经网络的无线覆盖智能优化系统模型
3.3业务流量预测优化
近年来移动互联网和智能终端的飞速发展带动了通信业务流量的激增,如何平衡网络业务负荷为用户带来良好的业务体验也是运营商关注的焦点。网络情况动态变化,用户业务需求随时间空间不断产生变化,需要从中挖掘特征,聚焦流量变化趋势,使网络在忙时能做到负荷平衡,保证用户体验,在闲时能智能关断部分基站设施,达到节能降本的效果。利用众多场景网络的多维度历史流量和网络质量数据,结合时间和场景特征基于人工智能技术进行数据分析挖掘,综合网络实际需求,进行流量预测,并使用负载均衡、动态资源调度、智能关断等策略,对网络流量进行优化调整。
4
人工智能在网络运维优化中应用面临的挑战
人工智能在网络中进行相关融合应用是大势所趋,但仍处于起步阶段,在网络中引入人工智能技术面临诸多挑战,需要在实际应用中边思考边解决。
首先人工智能的实际应用需要大量有效可靠的网络数据,网络数据在不同的网元或者系统生成,数据采集和汇聚需要硬件能力和系统架构的支撑和升级,多维数据源的处理关联需要考虑数据格式、异厂家融合等特性问题。网络数据标签化的手段也较少,有效数据获取成本较高,数据涵盖的场景和范围比较有限。
其次运维优化领域的知识专业性较强,在具体应用时需要明确业务逻辑,人工智能技术的学习特点具有黑盒特征,难以确定应用的需求和流程,可能会使最终应用的效果不明显。
再次人工智能对应用需求和目标存在概率性误差,由于获取的数据存在片面性,在特定数据下训练得到的AI模型和架构可能很难适用所有的需求场景,这对高标准的电信级服务是个巨大挑战,在实际落地应用之前,需持续迭代学习自我完善。
最后人工智能的应用还需要考虑人为的控制力如何介入,通信网络的运维优化生产需要安全稳定,AI应用的输出效果存在不确定性,而通信网络的运维优化要以安全稳定为前提,AI最终的定位是主导还是辅助还需要经过发展确定。
结语