我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:港台神算 > 读写周期 >

新计算 新网络 新旗舰:华为云C6实例首测

归档日期:06-19       文本归类:读写周期      文章编辑:爱尚语录

  弹性云服务器(ECS)是云计算最基础的服务之一,其性能和稳定性直接决定云计算的用户体验。每当有重大的计算或网络硬件更新,云服务器就会升级换代,将性能推向新的高度。显然,尽快将新的硬件技术应用于云服务器,是云服务商的核心竞争力之一。

  4 月 3 日上午,英特尔在太平洋两岸近乎同步的发布了代号CascadeLake的第二代至强可扩展处理器。中午 12 点,基于CascadeLake的华为云全新一代通用计算增强型云服务器C6 正式转为商用。此刻,北京的发布会尚未结束,距旧金山的发布会开始也还不到 12 小时。

  在正式转为商用之前,C6 和通用计算型云服务器S6 都经历了长达四周的公测阶段。换言之,大约在 3 月初,这两款基于新一代至强可扩展处理器的实例便已基本就位了。

  七年前推出的至强E5 系列奠定了英特尔在云计算领域的统治地位,经过前后 4 代的发展,于 2017 年转为代号Skylake的第一代至强可扩展处理器,这样算来,到CascadeLake就是第 6 代了。

  拥有定制版本的至强处理器是云计算服务商市场地位和规模的体现。在Skylake时代,华为云有两款定制处理器,分别用于C3/C3ne和S3,那么C6 和S6 自然对应两款华为定制版CascadeLake处理器。

  CascadeLake可以视为Skylake的完善版本,大多数 2 代型号主要体现为100~300MHz的频率提升。不过,C3 和C3ne实例的基频已经是国内一线云计算服务商同类产品中最高的了,频率上C6 只需继承基频3.0GHz、睿频3.4GHz的配置就可以了,最直观的改进是内核数量的增加——vCPU上限从 60 增加到64,并吸收了C3ne在网络方面的增强,不愧是华为云的旗舰系列。

  虚拟网络数据面转发首创集成流表方案,将业界传统流表用户态转发方式卸载到华为海思自研u-NIC芯片上,实现主机流量快表转发,全功能加速和卸载,最大内网带宽可达40G,网络包转发速率可到 1000 万PPS。

  虚拟网络数据面转发首创软硬结合的virtio后端软直通技术,零拷贝技术方案保证40Gbps流量进入虚拟机,同时保证对虚拟机内原生virtio前端兼容,无需升级GuestOS驱动,避免业界标准SR-IOV方案的部署难题。

  虚拟网络数据面转发各个模块(EVS/集成流表数据面/virtio-agent)设计解耦,支持failstatic特性,有效提高了健壮性和快速特性部署。

  在华为云C6 实例公测期间,E企研究院在 16 款不同配置的C6 实例中,选取了 4 款典型配置的C6 实例进行了测试,以评估其在计算、存储以及网络方面的性能表现。以下为我们用于测试的C6 实例配置:

  在C6 实例中实际上并不包括存储的配置(数据存储,OS盘不算其中),但在实际部署中,存储作为三大核心基础设施之一,其与计算、网络一起从不同角度应用整体系统的性能发挥,因此在关于华为云C6 实例的评估中,E企研究院也对华为云块存储——超高IO云硬盘——的性能进行测试。在c6.8xlarge. 4 实例上挂载了 1 块600GB容量的超高IO云硬盘,测试其随机读写性能(IOPS)与带宽吞吐量(MBPS,MB/s)。

  虽然在实际应用中,CPU和内存这两者几乎紧密相连,并影响应用系统的整体计算性能。但作为计算机系统中拥有各自技术路线的两个独立组件,通过相关测试软件,却能衡量各自的性能水平。

  在CPU运算性能方面,E企研究院使用GeekBench3 软件来评估C6 实例中的vCPU运算性能。GeekBench3 是一款轻量级的CPU基准性能测试软件,能够衡量CPU单核与多核状态下的整数与浮点运算性能,其结果得分以IntelCorei5-2520M(2.50GHz,用于Mac电脑中)的 2500 分为基线,以此换算得来,得分越高意味着性能越高。下图为C6 实例在不同配置下的整数运算与浮点运算性能得分:

  华为云不同(vCPU与内存容量)配置C6 实例计算性能得分,上述各项得分均为在相同条件下, 5 次重复测试获得得分后的平均得分

  上图中蓝线与灰线分别表示单核的整数与浮点运算性能得分,在不同vCPU配置下,其单核(整数与浮点)性能得分保持平稳,意味着其性能表现稳定,且底层采用同一款CPU硬件;橙色与黄色柱状图则分别为多核下的整数与浮点运算得分,即不同vCPU配置下,所有vCPU都参与测试后获得的整数与浮点运算综合得分。

  GeekBench网站公布的一款使用上一代IntelXeonGold6136(@3.0GHz,可睿频到3.7GHz)处理器的云主机vCPU测试结果。与E企研究院测试结果的单核得分相比,使用新一代CascadeLake定制处理器的华为云主机单核(整数)性能有超过15%的性能提升,单核性能高,核心更多,意味着多核性能将线性提高

  从测试结果来看,即使是测试所使用的最低配置的c6.xlarge.4(4vCPU与16GB内存)实例,其整数与浮点运算得分都接近1. 5 万分,并随着vCPU数量的提升,其性能逐渐提升,在最大配置的c6.16xlarge.4(64vCPU与256GB内存)实例中,其整数运算得分接近 12 万分,浮点运算得分超过 13 万分,几乎是4vCPU配置的 10 倍左右。

  在内存性能方面,华为云C6 实例亦有不俗的表现。E企研究院使用Stream基准测试软件来评估C6 实例的内存性能,Stream是业内公认的用于内存性能评估的基准测试软件,其包括Copy(复制)、Scale(乘法)、Add(加法)以及Triad(三者复合)四种不同操作情况下的内存带宽表现。E企研究院对华为云不同(vCPU与内存容量)配置的C6 实例进行 5 次重复测试后,取其平均成绩,具体如下图所示:

  上图中从左到右四种不同颜色依次表示c6.xlarge.4(4vCPU与16GB内存容量,即上图中的4c16G)、c6.4xlarge.4、c6.8xlarge. 4 与c6.16xlarge. 4 实例的内存带宽性能表现:随着C6 实例内存容量的增大,其内存性能越高

  实际上在去年华为云就发布了使用新一代高性能智能网卡的C3 网络增强型实例(即C3ne),现在华为云基于定制版英特尔CascadeLake处理器的C6 实例完全融合了ne系列网络增强能力,以匹配最新定制处理器带来的综合性能提升,扩大对企业应用场景的覆盖。

  根据主流应用对网络性能的不同需求,E企研究院针对C6 实例的网络性能测试主要分为两大类型:TCP和UDP使用场景。TCP主要用于建立长效的传输连接并保证数据的安全传输,比如基于http/https的web应用、ftp文件传输以及POP/SMTP的邮件应用等等,通常是一对一连接,更强调网络带宽实现的数据传输能力;UDP则是无状态传输协议,更强调数据传输的实时性,在网络质量不好的情况下运行丢包。最典型应用场景如在线视频播放、视频/音频会议、视频直播等等,UDP通常一对多,更关注收发包能力。

  E企研究院首先对C6 实例进行TCP带宽测试,选取相同配置的 3 台C6 实例进行配置:其中一台作为Server端,其余 2 台作为Client端。 2 台Client向Server端同时并发压力(数据包长1440),然后在Server端统计TCP带宽。根据E企研究院测试结果,华为云不同配置C6 实例的TCP带宽如下图所示:

  上图红线为E企研究院针对不同配置C6 实例的实测性能数据,橙色虚线为对应配置下的最高带宽。从测试结果可以看出,实测数据(红色实线 实例对应配置下的最高带宽

  E企研究院实测C6 实例UDP收发包能力(橙色柱状图)与华为云官方公布的最大收发包能力(黄色折线)

  华为云硬盘实际上早已有之,并不属于此次C6 实例的发布内容。但基于C6 实例部署应用,云硬盘又不可或缺,做为C6 实例的操作系统盘(即OS)或者数据存储。为了更全面地评估C6 实例在实际应用场景下的综合性能表现,E企研究院增加了对华为云硬盘的基准测试。

  一般而言,评估(块)存储性能通常有两个较为关键的指标,即IOPS和吞吐量(即MB/s)。前者通常以4KB数据块的随机读写性能作为衡量标准;带宽则通常以64K、128K或者1MB数据块尺寸的顺序读写带宽作为存储带宽标准。云硬盘实际性能高低通常又与所购买的容量大小相关,并且在公有云存储方面,为了更好地保障稳定性,通常会有一个最大IOPS性能(类似SSD的单盘最大IOPS性能),和一个基准性能(或曰最小IOPS性能),以及对应的存储QoS策略。

  以华为云超高IO盘为例,单个云硬盘IOPS性能=Min(“最大IOPS”,“基线IOPS+每GB云硬盘的IOPS×云硬盘容量”)。以E企研究院测试用600G容量作为说明,最大随机读写性能可达31500IOPS。如果将容量增加到或超过630GB,那么其最大随机读写性能则不超过33000IOPS。而在吞吐量方面则并没有那么复杂,只限制不超过350MB/s。下图为E企研究院针对600GB容量的超高IO盘的4K随机读写性能测试结果:

  从上图可以看到,华为云超高IO盘基本都在较低的 16 队列深度时获得最大IOPS——接达到31500IOPS。而在低于 16 队列深度时,随着队列深度的增加,其随机读写性能几乎以倍数增加;在超过 16 队列深度后,其性能稳定在31500IOPS。这显示了华为云高超的性能优化水平以及严格的存储QoS控制能力。

  上图为华为云超高IO盘的顺序读写带宽表现,橙色柱状图表示为1MB数据块的顺序读带宽——350MB/s,这已经与华为云官网所公布的最大存储带宽性能相吻合;蓝色折线MB数据块的顺序写带宽,在队列深度为 2 时获得最大350MB/s,此后读写带宽均保持平稳。较低队列深度就获得最大存储性能意味着能够为应用提供更好的支撑,减少应用优化的复杂程度。文/E企研究院曾智强 张广彬

本文链接:http://kandk-towing.com/duxiezhouqi/682.html