View a markdown version of this page

在服务级别运行故障模式评估 - AWS Resilience Hub

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在服务级别运行故障模式评估

您可以从控制台或使用 AWS CLI 运行故障模式评估。评估以异步方式运行。典型的完成时间为 5 到 15 分钟,具体取决于服务的复杂性。

先决条件

  • 必须配置该服务的调用者角色并且可以访问。

  • 应至少应用一项弹性政策。没有政策的评估仍在进行中,但得出的有针对性的结果较少。

开始故障模式评估(控制台)

  1. 导航到您的服务。

  2. 选择故障模式指导并添加有关您的服务的所有断言。有关更多信息,请参阅 故障模式指导

  3. 选择 “运行失败模式评估”

  4. 等待评估完成(通常为 5 到 15 分钟)。

开始故障模式评估 (CLI)

aws resiliencehubv2 start-failure-mode-assessment \ --service-arn "arn:aws:resiliencehub:us-east-1:123456789012:service/checkout:abc123"

查看评估状态

aws resiliencehubv2 list-failure-mode-assessments \ --service-arn "arn:aws:resiliencehub:..."

状态值的进度如下:PENDINGIN_PROGRESS、然后、SUCCESSFAILED

在评估期间,下一代 Resilience Hub 在后台运行资源发现:

  1. 下一代 Resilience Hub 将扮演你的召唤者角色。

  2. 从您配置的输入源(标签CloudFormation、Terraform 或 Amazon EKS)中读取资源。

  3. 识别父子关系(例如,Auto Scaling 群组与 Amazon EC2 实例)。

  4. 弹性中心为您的服务构建拓扑。

  5. 构建显示数据流和容器的拓扑。

拓扑完成后,可以在控制台中查看:

  • 图表视图-资源和连接的可视化地图。

  • 表格视图-包含元数据的所有已发现资源的列表。

  • JSON 导出-下载完整拓扑以进行外部分析。