首页 > 编程知识 正文

网关地址(阿里云人工智能布局)

时间:2023-05-04 02:56:53 阅读:73498 作者:1421

简介: XGW是洛神云网络平台硬件传输层的核心,提供高性能的网络传输能力,负责公共网、专线和Region之间的流量聚合和分发,用户大带宽、大单流、稳定性、流量2020年12月19日,首届中国云网络峰会上,AlibabaCloud (阿里巴巴云)展位挤满了人,里三层外三层,是什么引起了这么多人的兴趣?

为什么需要采用软硬件一体化架构

随着云在企业中的发展,网络带宽进一步扩大,虽然最初采用的是使用物理服务器和DPDK构建的方式,但服务器摩尔定律已经失效,需要更多的服务器来应对不断增长的流量诉求虽然也对配送运输、成本、电力消耗等产生了不良影响,但采用可编程硬件芯片对增加的流量诉求有效。 从一台服务器160G到当前可编程单芯片3.2T/6.4T,再到下一代12.8T,传输能力提高了几十倍,传输延迟更低,整体Capex和Opex大幅下降。 因此,硬件化是必然的选择。

软硬件一体化网关XGW应用场景

XGW是洛神云网络平台的硬件传输层核心,提供高性能的网络传输能力,基于英特尔可编程芯片进行开发

XGW负责公共网、专线和Region之间的流量聚合和分发,如下图所示

典型场景如下:

1 )用户通过互联网访问Alibaba云(阿里巴巴云),典型产品是EIP和共享带宽

2 )用户IDC接入Alibaba云(阿里巴巴云),使用高速公路(专线)作为典型产品

3 )云上的区域通信,如北京区域ECS访问深圳区域ECS,使用的典型产品是CEN

通过采用软硬件一体化的XGW,可以满足用户在上述场景中的巨大带宽和高质量需求

1 )大带宽)例如,天猫双11或某大客户数10Tbps专线上的云业务。

2 )大单流)例如,在IoT场景的GRE tunnel中,用单流计算Gbps。

3 )稳定性)无软传输的CPU充满风险。

4 )低时延/低抖动)硬件网关管道足够粗,客户处光滑如云,无卡顿,高速公路车道似乎足够多,车辆行驶平稳,无排/无堵塞。

客户案例

1 )客户信息)客户是世界知名的网络科技企业,拥有视频、信息、教育等多种知名的APP应用。

2 )业务诉求:客户采用混合云体系结构,带宽规模双向达到51.2Tbps,IDC机房和云上的网络全堆栈支持IPv6。

业务压力:规模巨大,IPv4地址资源耗尽,需要从全堆栈切换到IPv6

3 )解决方案:阿里巴巴云(AlibabaCloud )通过XGW硬件软件一体化网关,提供超宽带和混合云全栈IPv6支持

4 )规划价值)1)超宽带支持、独立3.2Tbps、水平可扩展2 )全堆栈IPv6、云IPv6和在线IPv6网络无缝连接

软硬件一体化网关XGW技术实践

XGW乍一看像2U服务器,但主要部件包括负责传输大流量的P4可编程交换芯片、负责传输大条目的自研网卡芯片,以及负责业务组织和智能调度的CPU模块

1)芯片选择

选择了程控交换芯片的途径,首先遇到的问题是芯片选择AlibabaCloud (阿里巴巴云)有多种选择,首先是使用传统的AISC卡。 这是因为传统网络设备交换机的AISC已经非常成熟。 二是P4可编程AISC芯片——可编程能力越来越高的芯片。 另一个FPGA,从传统意义上讲,也是硬件芯片。

最终的Alibaba云(阿里巴巴云)选择了P4可编程的AISC芯片。 因为,虽然业务有快速迭代的诉求,但传统的AISC芯片功能已经固化,没有完全一致的诉求。 此外,许多传输行为是定制的,传统的AISC芯片无法支持,因此需要灵活、可编程的硬件芯片。

在可编程硬件芯片上,传统的FPGA非常灵活,但其功耗和成本相对较高,在相同传输能力的情况下,其功耗和成本都比p4可编程AISC芯片高很多,所以AlibabaCloud (阿里巴巴云)

2)芯片表项的优化

可编程芯片也带来了挑战。 处于芯片表项目的限制。 因为硬件芯片的显示项目有限,所以必须考虑芯片的面积、功耗和成本。 原始软转发条目存在于存储器中,基本上可以变大。 因此,APP应用芯片作为传输网元最大的挑战是表项的规模。 与此相对,AlibabaCloud (阿里巴巴云)也进行了很多优化。

首先,AlibabaCloud (阿里巴巴云)充分挖掘了芯片的能力。 传输芯片包括多个pipeline,通过多个pipeline共同实现高速传输性能。 最简单的编程方式是为每个pipeline分发相同的条目,所有处理逻辑都是对称的,整体传输模型非常简单。 但是,这种方式也有相应的代价,每个pipeline中存储的同一条目是整个芯片的对外能力。

考虑到芯片传输模型的特点,阿里巴巴云(AlibabaCloud )采用不对称的传输方式,处理逻辑分布在不同的pipeline上,将不同的pipeline条目重叠,从而提高传输条目的能力

然后,Alibaba云(阿里巴巴云)优化了整个软件的表项格式。 在软传输的转换模型中,为了清楚和简单,很多表是独立的。 例如,一个简单的产品可能使用多个表,每个表都有不同的属性,但如果多个表是在硬件中实现的,则表项的空间会相对较大。 考虑进行合并表,可以有效提高整个芯片表项目的利用率。

3)实现网络QoS

ng>
利用可编程芯片数据平面,实现网络QoS的能力。大规模租户的应用较复杂,部门较多,不同应用的优先级不一样,对于带宽的要求也不一样,如果每个应用都按照它最大带宽来购买,成本会非常高。所以,许多超大规模客户希望购买一定带宽,然后在发生堵塞的时候先丢弃优先级低的报文,保证高优先级的报文通过。通过可编程数据平面可以实现了这样的QoS的功能。

综合来看,通过数据平面的可编程能力,和软硬一体化的架构,洛神平台数据平面提供了超高的转发性能,大大提升了芯片的表项规模,并且硬件芯片在云计算网络里已经规模化应用。

软硬件一体化未来优化
云网络未来将从以下几个方面进行优化:

1)异构芯片。当前阿里云使用的Barefoot P4可编程芯片,未来阿里云可能会使用多厂商的异构芯片,比如阿里自研芯片、Broadcom芯片等。通过芯片适配层,可以有效的屏蔽芯片的差异,做到快速上线。

2)网络安全。随着大量不同行业的租户上云,对网络加密安全有了更高的要求。通过可编程的数据平面提供加密的功能,来支撑不同的客户的诉求。

3)网络可视化。网络往往是一个黑盒,未来通过可编程的数据面,可将网络里面转发的信息携带到网络的处理系统里,实现网络可视化,帮助网络更有效的支撑业务系统,同时增强网络的运维能力。

原文链接:https://developer.aliyun.com/article/780471?

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。