安全+数智 AI赢未来 C3安全大会·2025盛大启幕——AI XDR开启体系化联动防御新时代CMG 世界机器人大赛今晚开赛,机甲格斗选手准备就绪C919 国产大飞机完成厦门首航,今起在厦沪快线常态化执飞马斯克宣布回归 7x24 小时工作状态,专注于 X、xAI、特斯拉等拥有完全自主知识产权:中国航发 2MW 级纯氢燃气轮机连续稳定运行时长破 7000 小时宝马高性能子品牌 Alpina 创始人家族推出手工定制跑车:基于 M4 打造,极速突破 300km/h京东Joy Inside联手商汤元萝卜 AI下棋“家教”正式上线开源共建智启未来 开源鸿蒙开发者大会2025成功举办微博管理员回应推出“黑粉”标识:纯属 P 图,站内无此标识挑战英伟达垄断地位:和硕展示基于 AMD MI350X 的 1177 PFLOP 级 AI 机架Sensor Tower 报告 4 月全球手游收入:《王者荣耀》强势上升四位,重回榜首微软为 Mesa 3D 图形堆栈贡献超 6 万行代码,推出全新 Gallium3D 前端除 Mac Studio 外,苹果曾考虑将 M3 Ultra芯片应用到 MacBook Pro 中从华为智能电动DriveONE运动域看新能源汽车行业发展困境与破局之道埃克塞尔集团携手孝南区共绘算力经济新蓝图——“数智创新 算力未来”主题活动助推区域高质量发展中国企业管理,迈入AI时代当 “度电续航” 成为硬指标:华为智能电动DriveONE如何重塑新能源汽车评价体系?华为智能电动DriveONE:重新定义新能源汽车的续航与安全湖北消费者来京东购3C数码 享国补多重补贴 还有至多500元加补福利埃夫特与华为云携手推进具身智能领域合作
  • 首页 > 企业IT频道 > 人工智能

    从算法到智能,智能运维的实践之路

    2020年06月05日 15:26:33   来源:ITBear科技资讯

      作者:王立新

      随着企业数字化转型的不断深入,利用AI技术改善运维和IT服务水平成为当前运维管理的主要关注方向。在此过程中逐渐产生了不同的发展策略:围绕着AI的平台化智能运维发展模式、场景化智能运维发展模式以及自建智能运维发展模式。

      不同发展策略的智能运维发展方向是一致的,即通过大数据和人工智能技术对运维管理进行赋能:

      ●结合现有监控手段,增强数据分析,进一步提高监控的能力;

      ●通过资源的有效配置节省运维成本;

      ●通过多数据源分析增强排查问题的能力,有效缩短故障恢复时间;

      ●通过预警并结合自动化工具,有效提高运维效率甚至自愈能力。

      目前智能运维尚处在弱人工智能阶段,人机协作的方式将促进智能运维的发展,人教会AI去学习,AI实现对数据的智能分析,提高运维人员的运营能力。

      建设智能运维的算法挑战

      虽然这几年人工智能在人脸识别、智能驾驶等领域得到了大量应用,但是AI仍然面临着计算效能、安全、可解释性等诸多挑战。相比于其他AI落地场景,智能运维所亟需解决的问题具有一定的独特性:

      1、心态的转变:智能运维是运维发展的方向,而且是一个长期的过程——从经验主义到数据驱动,再回归到业务驱动的过程。经验是结合了数据、知识、业务等长时间学习的结果,而AI主要依靠历史指标或者文本数据,对历史数据进行预测,从而对未来趋势做出判断。对于想达到的目标,需要考虑现有的信息是否充足,还需要结合业务场景进行具体模型的不断优化。

      2、工程化算法的欠缺:由于缺乏标准的运维数据集,学术界针对运维的算法还比较少,工程化的算法尤其欠缺。同时算法在不同数据集上的泛化能力也决定了算法能否在真实场景应用的关键。

      3、缺乏有效的标签体系:以异常定义为例,由于不同业务部门对数据需求存在巨大区别,同时对异常的容忍程度也有不同定义,因此现有的泛化模型难以满足用户的实际需求。

      4、数据的多样化和变更频繁:运维场景存在大量变更行为,因此需要考虑Concept-shift(如:促销中的变更)前后对算法结果的影响。

      5、唯一性:很多异常和故障的特征是唯一的,很难通过历史数据的学习得到,因此需要结合业务属性和其它数据进行有效学习。

      6、算法失效带来的灾难:AI的应用需要明确目标和不确定性。工业化算法的准确性在85%以上可以用,但是需要考虑不准确情景的影响。算法很多时候需要考虑准确和召回的集合(F-score),而很多场景对算法的准确性有更高要求,因此对算法结果的评估将有助于进一步完善模型。

      提升智能运维关键能力

      面对上述算法落地挑战,需要对运维场景进行剖析,将学术界的算法和业界的场景有效的融合统一,再通过业界的工程实现能力进行有效的组合。对于每个场景的实现,都不仅仅是一个或多个算法。在智能运维的落地的过程中,一般会构建四个智能分析能力集合:

      ●智能告警能力

      及时有效的告警是运维的基础。智能运维常常利用异常检测来实现智能告警,但是异常检测主要是找出数据的异常,而告警是业务驱动的,因此在设计告警条件时,需要集合异常检测和业务的特性进行告警。

      ●智能诊断能力

      当关键业务指标发生异常时,快速给出问题的根本原因的能力。在运维过程中,根因很可能是唯一的,不能通过历史学习的方式构建,需要一个系统性设计,构建完善的运维分析库,通过有效的学习对故障进行快速定位。

      ●智能预警能力

      通过基于历史数据的有效学习,对未来可能的故障进行有效预测是减少损失的重要手段。故障的类型很多,针对不同类型的预测需要不同的算法模型。当故障发生时,配合资源优化算法,自动化的对任务进行编排,从而有效、及时预测故障的发生。

      ●智能服务管理能力

      智能服务管理能力将利用人工智能技术,与新一代ITSM进行融合。通过知识库的构建,利用文本相似度,对历史上发生的故障工单进行匹配,及时有效的提供故障的解决方案,大大提升了故障的处理效率,结合自动化的工具,快速给出请求回复,减少运维人员的时间浪费。

      注重算法的鲁棒性、自适应性、可解释性、泛化能力等,通过构建专业运维数据库以及智能分析方面的4个关键能力,将为企业智能运维体系化建设提供有力支撑,落地从运维的监控预警、告警、诊断分析、事件管理和知识推荐的全链路智能系统。

      发展与展望

      随着AIOps应用不断的深入,智能运维将会在纵向和横向不断延伸。横向上,智能运维应用场景将会从ITOM向ITOA、ITSM和ITBM发展,覆盖更多的运维领域。纵向上,随着运维数据成熟度以及AI能力的提升,智能运维将从机器学习向深度学习、增强学习甚至向元学习能力延伸。这种纵横能力的覆盖,将实现AI对整个运维场景的可见、可控、可分析、可管理。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. H001]
    分享到微信

    即时

    vivo携手首届商学院戈壁友谊赛,以专业影像见证无畏征途

    2025年5月4日,首届商学院戈壁友谊赛于甘肃省酒泉市圆满举办。在这场4天121公里的戈壁征途中,vivo作为战略合作伙伴,为赛事提供手机、智能穿戴设备及定制影像服务,以技术赋能助力参赛选手与观众记录戈壁之上的热血奔赴,共同探索科技进步、商业文明与自然共生的未来路径。

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。