数据中心网络正从云时代迈入AI时代 作者: 来源:《中国信息化周报》2019年第02期 近日,华为发布了业界首款面向AI时代数据中心交换机CloudEngine 16800,将人工智能技术创新性地应用到数据中心交换机,引领数据中心网络迈入AI时代。 当前,数字化转型的持续推进,正在提速驱动数据量暴增;同时,语音/视频等非结构化数据占比持续提高,庞大的数据量和处理难度已远超人类的处理能力,需要基于机器运算深度学习的AI算法来完成海量无效数据的筛选和有用信息的自动重组,从而获得高效的决策建议和智慧化的行为指引。 根据华为GIV 2025的预测,企业对AI的采用率将从2015年的16%增加到2025年的86%,越来越多的企业将利用AI助力决策、重塑商业模式与生态系统、重建客户体验。 作为人工智能的“孵化工厂”,数据中心网络正成为AI等新型基础设施的核心。但与此同时,随着AI时代的到来,AI人工智能的算力也受到数据中心网络性能的影响,正在成为AI商用进程的一大瓶颈。 华为网络产品线总裁胡克文指出,AI时代的数据中心网络将面临以下三大挑战: AI算力 高性能数据中心集群对网络丢包异常敏感,未来的网络应该做到零丢包。但传统的以太网即使千分之一的丢包率,都将导致数据中心的AI算力只能发挥50%。 大带宽 未来5年,数字洪水猛增近20倍,现有100GE的网络无法支撑。预计全球年新增数据量将从2018年的10ZB猛增到2025年的180ZB(即1800亿TB),现有100GE为主的数据中心网络已无法支撑数据洪水的挑战。 面向自动驾驶网络的能力 随着数据中心服务器规模的增加,以及计算网络、存储网络和数据网络三网融合,传统人工运维手段已难以为继,亟须引入创新的技术提升智能化运维的能力,如何用新的技术去使能、把网络问题排查出来成为业界都在思考的问题。 与此同时,华为也定义了AI时代数据中心交换机的三大特征: 1.业界首款内嵌AI芯片数据中心交换机,100%发挥AI算力。CloudEngine 16800是业界首款搭载高性能AI芯片的数据中心交换机,承载独创的iLossLess智能无损交换算法,实现流量模型自适应自优化,从而在零丢包基础上获得更低时延和更高吞吐的网络性能,克服传统以太网丢包导致的算力损失,将AI算力从50%提升到100%,数据存储IOPS(Input/Output Operations Per Second)性能提升30%。 2.业界最高密度单槽位48 x 400GE,满足AI时代5倍流量增长需求。数据中心是互联网业务流量汇聚点,企业AI等新型业务驱动了数据中服务器从10G到25G甚至100G的切换,这就必然要求交换机支持400G接口,400GE接口标准化工作已经于2015年启动,目前针对数据中心应用已经完成标准化,400G时代已经来临。 3.使能自动驾驶网络,秒级故障识别、分钟级故障自动定位。CloudEngine 16800基于内置的AI芯片,可大幅度提升“网络边缘”即设备级的智能化水平,使得交换机具备本地推理和实時快速决策的能力;通过本地智能结合集中的FabricInsight网络分析器,构建分布式AI运维架构,可实现秒级故障识别和分钟级故障自动定位,使能“自动驾驶网络”加速到来。该架构还可大幅提升运维系统的灵活性和可部署性。 本文来源:https://www.wddqw.com/doc/38fc20f3ce1755270722192e453610661ed95aa8.html