时间:2023-06-29作者:admin浏览: 次
欧亿注册不久前,国际权威研究机构Gartner发布了研究报告,横向对比了全球五大顶级云计算厂商,分别是美国的亚马逊AWS、微软Azure、谷歌的Google Cloud、甲骨文,还有中国的阿里云。
这次评价的维度非常全面,涵盖了云计算和云数据中心的几乎所有方面,包括最主要四大件:计算、存储、网络、安全,以及软件基础设施、云数据中心的运营和治理等等很多大的方向。让很多人意外的是,
咱们的老读者都知道,云数据中心是我一直从事和关注的领域。这个报告的全名叫“云计算厂商基础设施和平台服务解决方案记分卡”,它是一个巨大的Excel表格,把前面所说的每个大的领域都进一步划分成了几十个小的测试,并且设置了比较高的评价和考核标准。绝大部分都是各种功能特性,有这个功能、且满足要求就得分,否则就不得分。
。这三个部分的权重不一样,最后汇总各个小项和部分,加权得到每家公司的最终分数。
它有点类似于咱们上学考体育的时候老师拿的考核表,比如要考田径、体操、篮球等等几个大项,每个大项还分小项,比如田径必考一百米跑进11秒以内,建议考跳远跳五米,可选考察仰卧起坐、每分钟做一百个。根据考核条件的难易程度,参加考试的人有可能在某些项目里全都达到、或者全都达不到要求。
这样做的好处,就是给出了一个非常明确而相对公平的定量考核标准,达到就是达到,没达到就是没达到,所有测试都是第三方完成,想杠都没法杠。根据这次的测试,我们可以站在非常中立的角度,不吹不黑,去看看阿里云到底哪里做的好,哪里做的还不够好。
首先来看云服务四大件里的“计算(Compute)”,这里的必考项有11项,建议功能12项、可选功能10项,这里阿里云在必须和建议这两个小项里拿到满分,只在可选功能里丢了三分,所以总分取得了第一。
。快指的就是快速部署,也就是在最短的时间里完成一个服务的部署,比如对虚拟机的快速部署、对容器的快速部署、对裸金属的快速部署等等。
拿虚拟机来说,这次参加这个“比赛”的五个公司都不是吃素的,也是PK掉很多其他知名云厂商才拿到的入场券,所以虚拟机的快速部署都通过了测试。不过,根据测试的细节,这里得分的标准是单个Linux虚拟机的部署时间小于1分钟,而阿里云只用了29秒。相比之下,微软Azure用了39秒,AWS34秒、谷歌云12秒、甲骨文45秒。从这个角度看,其实大家卷的很厉害,差距都是在伯仲之间。
但是在裸金属和容器的快速部署环节,就渐渐分出了差别。这两个都是现在云数据中心新兴的、但是慢慢变的主流的计算场景。裸金属Baremetal,由于没有虚拟机那些额外的开销,所以可以提供更加极致的性能。而容器则可以更加的灵活和轻量化。
。在裸金属的快速部署上,阿里云平均需要2分19秒,但可以提供块存储和虚拟网络。相比之下,第二名甲骨文则需要5分20秒,而微软需要超过10分钟,谷歌压根就没有裸金属的支持。
对于容器的快速部署,阿里云平均用时34秒,第二名微软需要57秒。而其他三个厂商则没有通过测试。
说到这里,就不得不提一下阿里云的弹性裸金属服务器,也就是很多朋友都听说过的神龙服务器,以及很多朋友不那么熟悉的MOC卡,它们都是完全由阿里云自研的架构和技术。这些就是驱动阿里云能够快速部署各种不同计算实例的根本性的原因。除了快速部署之外,神龙架构的最主要特点就是能结合虚拟化和裸金属的优点,既能实现高性能,又能实现快速部署、也就是所谓的弹性伸缩,以及很好的安全性,并且提供多种网络和存储的功能。
衡量云厂商计算能力的第二个标准就是多。这里指的不仅是VM的数量要多,而且要支持大的虚拟机。还有一个标准就是多样化,也就是前面说的裸金属、容器,还有很多其他的各种各样神奇的要求,比如任意大小的虚拟机,对不同CPU的支持,对安全性的支持等等。
值得注意的是,阿里云这里三个失分项之一,是可选功能里的安全性,也就是对SGX的支持。SGX全名叫软件防护扩展技术,也就是通过指令,请求CPU在内存中分配出来一块受CPU保护的区域,也叫做“飞地”,这样可以保护代码和数据不受操作系统或者VMM的影响,避免数据和应用被非法复制和篡改。SGX这个功能在英特尔的Ice Lake CPU里做了集成。在做这个测试的时候阿里云还没支持SGX,但是好像现在已经支持了。
前面说的都是对云厂商计算能力的测试,每一项都有非常明确的可以量化的评价标准,大家应该也可以体会出来这次的竞争有多么激烈了。我知道肯定会有人说,怎么没比较谁谁谁,其实没上榜的厂商也完全可以自己对比这个表格,做一下这些测试,然后用数据和结果说话。
除了计算之外,这个测试还包括了对网络、存储、还有安全的考核。比如在网络这个项目里有些很有意思的项目,有些测试只有阿里云通过了,其他四家都挂了,比如跨云的连接,也就是阿里云与AWS和Azure直接的互联互通,就只有阿里云做到了。还有一些性能可视化的功能,也就是实时观测数据中心网络的延时、吞吐量等等数据,并且提供30天的历史记录,这个功能也只有阿里云能提供。
,但是报告里也没有给出具体的细节。当然还有一些大家都挂了的功能,比如存储里的跨区域文件自动复制的功能,这个其实是一种容灾恢复机制,本质上是在跨地域的数据中心里自动进行文件复制,防止某个地方的数据中心遭遇天灾人祸,里面的数据就没了。
总之,在计算、网络、存储、安全,这四个云数据中心最重要的性能指标的PK里,阿里云都取得了第一名。
如果去推敲取得这样成绩的原因,我觉得本质上就是因为阿里云在不断坚持自研技术与创新。除了前面说的主要用于计算的神龙架构之外,
,这些都是阿里云在过去的几十年里一点一点积累起来的技术。当然了,并不是说阿里云就宇宙无敌了。事实上阿里云的问题还有很多,我觉得最重要的一个就是全球化。管理与生态合作也是阿里云在这份报告里得分最低的部分。
阿里云的绝大部分业务都在亚洲,可能大部分都在中国。在欧美的布局很少,只在美国有两处、欧洲两处、中东一处,而南美一处都没有。这和亚马逊微软这样的全球化网络相比,差距非常明显,所以这也在很大程度上拉低了阿里云的整体分数。
在报告里也提到,阿里云的英文文档做的并不好,很多功能和服务都没有,表述的也并不准确。我觉得这个是很中肯的批评,和全球化不同,是可以直接去改进的事情。
全球化应该是历史进程发展的大方向。虽然对于中国企业来说,全球化或许会遇到更多这样那样的困难,但也有很多非常成功的案例,比如某为、比如某音,再比如某米,还有很多游戏产品,都在全球范围内取得了成功。所以这些应该也能为阿里云更好的全球化提供参考和借鉴。特别是现在国内很多其他的云厂商也在不断崛起,与其大家在国内市场不断内卷,不如放眼全球,从大江大河跳到大海里,鹰击长空鱼翔浅底,靠技术说话,我觉得这才符合我印象里那些阿里技术人的胸怀和格局。
在2008年王坚加入阿里巴巴的时候,几乎没人知道什么是云计算。2009年成立的时候,应该也没人相信阿里云能做到今天这个样子。我们姑且不说阿里云是不是全球第三,亚洲第一,我们就单看这个表格里几百项的测试、实打实的数据,作为一个工程师和技术从业者,我觉得这就能说明很多事情。
不知道大家有没有看过一篇文章,叫《阿里云的这群疯子》,文章最后的一句话,我觉得也适合作为本文的结尾:
Uzi实力倒退五年,打出LPL最高击杀,赛后语音公开,Fofo当场道歉
16年电商人:大促曾经让暴富触手可及,今年618 GMV却比去年少了近一半
“ 孩子,是妈妈害了你!”8岁女孩骨龄老3年,再难长高!医生怒骂:近3成的孩子,都是“吃”出来的
网传高考677分的学霸作息表,有人看过表示很佩服,有人直呼:窒息得要死!