阿里云12日发生的全球性故障再次将“云集中风险”推上风口浪尖。这一公有云史上罕见的事件不仅影响了数以万计的企业和服务,也引发了对云服务集中化趋势的深刻反思。
2023年11月12日17:44(GMT+8)开始,阿里云基础设施发生严重故障,导致阿里巴巴大量产品无法连接,“阿里云盘崩了”“淘宝又崩了”“闲鱼崩了”“钉钉崩了” 等话题相继登上热搜,阿里系诸多产品受到影响。
故障期间阿里云控制台无法正常登录,API调用异常,导致阿里云全系列产品服务及全球区域(包括阿里云位于中国内地、港澳台、亚洲其他地区、欧洲、北美、中东、政务云以及金融云等)数据中心均受影响。
故障恢复期间,一些用户抱怨由于DNS服务也出现问题,导致无法做故障转移,“想跑都跑不了”。
根据阿里云发布的通知,故障持续了3个多小时后才基本完全恢复:
阿里云此次全球性故障的严重程度、影响规模和范围在公有云历史上都极为罕见,严重打击了各行业用户对公有云可靠性和安全性的信心,进一步凸显了Gartner三季度风险报告中强调的“云集中”风险。
“云集中”名列五大新兴风险榜单
根据Gartner最新公布的2023年三季度新兴风险报告,云集中风险连续第二年进入“五大新兴风险”综合榜单:
在美国和中国市场,云集中风险则更为突出(排名分别上升至第三):
Gartner法律风险与合规实践部门研究总监徐然表示:“云服务集中化风险正在成为大多数企业的共识。许多企业和机构现在面临这样的处境:一旦单个云服务商出现故障,将导致业务发生严重中断。”
“云集中”的三大风险
导致“云集中风险”的原因有很多,许多组织为了降低IT复杂性、成本和技能要求,选择将IT服务集中在少数几个战略云供应商手中;而加剧这一风险的是,少数几个云计算巨头凭借其技术能力优势、业务覆盖范围和合作伙伴生态系统,在全球和区域市场占据主导地位。
徐然表示:“对于那些选择将其IT服务托管在公共云中的组织来说,要避免云集中风险的同时又获得云服务的好处,很难兼顾。此外,国家和次国家层面的法规在处理集中风险、反竞争、数据主权和云服务隐私规则方面存在分歧,这进一步复杂化了情况。”
根据Gartner的说法,云集中目前主要有三大风险:
如何缓解云集中风险
徐然表示:“目前,如果公共云的优点对企业战略至关重要,企业迫切需要制订一个完备的连续性计划,以应对可能面临的任何重大云服务风险。”
知名密码学专家布鲁斯施奈尔认为,增加云服务商数量并不能从根本上降低“云风险”,他在IEEE Spectrum上撰文指出:
在全球科技巨头和云服务商争先恐后“大炼数据”的生成式人工智能时代,企业和个人对存放于云端数据的安全焦虑与日俱增,一个可行的策略是将身份、数据和行为解耦合。
“企业不应再对云服务商的数据安全能力和意愿抱有幻想,企业唯一的出路是将数据安全重新掌握在自己手中。”施奈尔说道。
参考链接
https://help.aliyun.com/noticelist/articleid/1064981333.html?spm=a2c4g.789004748.n2.6.3ebb18650gVvWF
https://www.gartner.com/en/newsroom/press-releases/2023-10-30-gartner-says-cloud-concentration-now-a-significant-emerging-risk-for-many-organizations
来源:GoUpSec