新闻资讯

News information

阿里云 11.12 故障原因曝光:AK 异常

发布时间:2023-11-16 02:52:08 |   阅读量:4947  |  文章来源:电竞竞猜官网,lol正规押注平台,电竞比赛竞猜平台


今日,阿里2023年11月12日阿里云发给客户的云故因曝K异一份「官方故障报告」曝光。

影响范围

1、障原OSS、阿里OTS、云故因曝K异SLS、障原MNS 等产品的阿里部分服务受到影响,大部分产品如 ECS、云故因曝K异RDS、障原网络等运行不受影响。阿里

2、云故因曝K异云产品控制台、障原管控 API 等功能受到影响。阿里

时间

2023年11月12日17:39~19.20,云故因曝K异故障时间为 1 小时 41 分。障原

问题概况

2023 年 11月 12 日 17:39 起,阿里云云产品控制台访问及管控 API调用出现异常、部分云产品服务访问异常,工程师排查故障原因与访问密钥服务 (AK)异常有关。工程师修订白名单版本后,采取分批重启 AK 服务的措施,于 18:35 开始陆续恢复,19:20 绝大部分 Region 产品控制台和管控 API 恢复。

处理过程

17:39:阿里云云产品控制台访问及管控 API 调用出现异常。

17:50:工程师确认故障是 AK 服务异常导致,影响云产品控制台、管控 API 调用异常,以及依赖 AK 服务的云产品服务运行异常。

18:01:工程师定位到根因。

18:07:开始执行恢复措施,包括修订白名单版本、重启 AK 服务。

18:35:杭州等 Region 开始恢复正常。

19:20:绝大部分 Region 的云产品控制台和管控 API 调用恢复正常。

原因

访问密钥服务 (AK)在读取白名单数据时出现读取异常,因处理读取异常的代码存在逻辑缺陷,生成了一份不完整白名单,导致不在此白名单中的有效请求失败,影响云产品控制台及管控 API 服务出现异常,同时部分依赖 AK 服务的产品因不完整的白名单出现部分服务运行异常。

改进措施

1、增加 AK 服务白名单生成结果的校验及告警拦截能力。

2、增加 AK 服务白名单更新的灰度验证逻辑,提前发现异常。

3、增加 AK 服务白名单的快速恢复能力。

4、加强云产品侧的联动恢复能力。

电竞竞猜官网,lol正规押注平台,电竞比赛竞猜平台

卢尼:克莱不该被驱逐 很意外戈贝尔什么事都没 谭咏麟病愈后首次公开现身,瘦到青筋毕现感慨声线不好 超大杯邀请赛!梅西率迈阿密国际11月相聚青岛成都 天黑了!罗马诺:贾西姆报价全资收购曼联再遭拒,已退出谈判 勇士无力赢球,痛批维金斯攻防两端生涯最差,忍痛割爱是唯一出路 湖媒对希菲诺绝望?多笔交易模拟皆有他:127中37+三分31中6 他让布林肯等了数小时,一开始便谈要求... 一文读懂曼联出售闹剧:70亿豪购+15亿投资被拒 红魔天又暗了? 山东一学校校服被吐槽“太瘆人”,款式像是寿衣,网友:一言难尽 已经确定出席本次峰会的外国政要名单