

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Amazon MWAA 的监控和指标
<a name="cw-metrics"></a>

监控是维护适用于 Apache Airflow 的亚马逊托管工作流程和您的解决方案的可靠性、可用性和性能的重要组成部分。 AWS 我们建议从 AWS 解决方案的各个部分收集监控数据，以便在出现多点故障时可以更轻松地进行调试。本主题 AWS 介绍用于监控您的 Amazon MWAA 环境和响应潜在事件的资源。

**注意**  
[Apache Airflow 指标和日志记录受亚马逊标准定价的约束。 CloudWatch ](https://aws.amazon.com/cloudwatch/pricing/)

有关监控 Apache Airflow 的更多信息，请参阅 Apache Airflow 文档网站中的[日志和监控](https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/index.html)。

**Topics**
+ [Amazon MWAA 上的监控概述](monitoring-overview.md)
+ [访问审核日志 AWS CloudTrail](monitoring-cloudtrail.md)
+ [访问 Amazon 中的 Airflow 日志 CloudWatch](monitoring-airflow.md)
+ [监控 Amazon MWAA 上的控制面板和警报](monitoring-dashboard.md)
+ [中的 Apache Airflow 环境指标 CloudWatch](access-metrics-cw.md)
+ [Amazon MWAA 的容器、队列和数据库指标](accessing-metrics-cw-container-queue-db.md)

# Amazon MWAA 上的监控概述
<a name="monitoring-overview"></a>

本页介绍用于监控适用于 Apache Airflow 的亚马逊托管工作流程环境的 AWS 服务。

**Contents**
+ [亚马逊 CloudWatch 概述](#monitoring-metrics-cw-about)
+ [AWS CloudTrail 概览](#monitoring-metrics-ct-about)

## 亚马逊 CloudWatch 概述
<a name="monitoring-metrics-cw-about"></a>

CloudWatch 是一个 AWS 服务指标存储库，可用于根据服务发布的[指标](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_concepts.html#Metric)和[维](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_concepts.html#Dimension)度检索统计数据。您可以使用这些指标来配置[警报](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_concepts.html#CloudWatchAlarms)、计算统计数据，然后在控制[面板](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html)中显示数据，以帮助您在 Amazon CloudWatch 控制台中评估环境的运行状况。

Apache Airflow 已经设置为向亚马逊发送适用于 Apache Airflow 的亚马逊托管工作流程环境的 [StatSD](https://github.com/etsy/statsd) 指标。 CloudWatch

要了解更多信息，请参阅[什么是亚马逊 CloudWatch？](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 。

## AWS CloudTrail 概览
<a name="monitoring-metrics-ct-about"></a>

CloudTrail 是一项审计服务，用于记录用户、角色或 AWS 服务在 Amazon MWAA 中采取的操作。使用收集到的信息 CloudTrail，您可以确定向 Amazon MWAA 发出的请求、发出请求的 IP 地址、谁发出了请求、何时提出请求，以及审计日志中提供的其他详细信息。

要了解更多信息，请参阅[什么是 AWS CloudTrail？](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-user-guide.html) 。

# 访问审核日志 AWS CloudTrail
<a name="monitoring-cloudtrail"></a>

AWS CloudTrail 在你创建 AWS 账户 时已在你上启用。 CloudTrail 记录 IAM 实体或 AWS 服务（例如适用于 Apache Airflow 的亚马逊托管工作流程）所进行的活动，该活动被记录为事件。 CloudTrail 您可以在 CloudTrail 控制台中查看、搜索和下载过去 90 天的事件历史记录。 CloudTrail 捕获亚马逊 MWAA 控制台上的所有事件以及对亚马逊 MWAA 的所有调用。 APIs但不会捕获只读操作（例如 `GetEnvironment` 或 `PublishMetrics` 动作）。本页介绍 CloudTrail 如何使用监控 Amazon MWAA 的事件。

**Contents**
+ [在中创建跟踪 CloudTrail](#monitoring-cloudtrail-create)
+ [使用事件历史记录访问 CloudTrail 事件](#monitoring-cloudtrail-view)
+ [`CreateEnvironment` 的示例跟踪](#monitoring-cloudtrail-logs-ex)
+ [接下来做什么？](#monitoring-cloudtrail-next-up)

## 在中创建跟踪 CloudTrail
<a name="monitoring-cloudtrail-create"></a>

您需要创建跟踪才能访问您中的持续事件记录 AWS 账户，包括 Amazon MWAA 的事件。跟踪允许 CloudTrail 将日志文件传输到 Amazon S3 存储桶。如果您不创建跟踪，您仍然可以在 CloudTrail 控制台中访问可用的事件历史记录。例如，使用收集的信息 CloudTrail，您可以确定向 Amazon MWAA 发出的请求、发出请求的 IP 地址、谁发出了请求、何时发出请求以及其他详细信息。要了解更多信息，请参阅[为您的 AWS 账户创建跟踪](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-create-and-update-a-trail.html)。

## 使用事件历史记录访问 CloudTrail 事件
<a name="monitoring-cloudtrail-view"></a>

您可以通过查看事件历史记录，在 CloudTrail 控制台中对过去 90 天的操作和安全事件进行故障排除。例如，您可以按区域访问与创建、修改或删除您的 AWS 账户 资源（例如 IAM 用户或其他 AWS 资源）相关的事件。要了解更多信息，请参阅[使用事件历史记录访问 CloudTrail 事件](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/view-cloudtrail-events.html)。

1. 打开 [CloudTrail 控制台](https://console.aws.amazon.com/cloudtrail/home#)。

1. 选择**事件历史记录**。

1. 选择要查看的事件，然后选择**比较事件详细信息**。

## `CreateEnvironment` 的示例跟踪
<a name="monitoring-cloudtrail-logs-ex"></a>

跟踪记录是一种配置，可用于将事件作为日志文件传送到您指定的 Simple Storage Service（Amazon S3）存储桶。

CloudTrail 日志文件包含一个或多个日志条目。事件代表来自任何来源的单个请求，包括有关所请求操作的信息，例如操作的日期和时间或请求参数。 CloudTrail 日志文件不是公共 API 调用的有序堆栈跟踪，也没有按任何特定顺序列出。以下示例是由于缺乏权 限而被拒绝的 `CreateEnvironment` 操作的日志条目。为了保护隐私，`AirflowConfigurationOptions` 中的值已被删除。

```
{
  "eventVersion": "1.05",
  "userIdentity": {
    "type": "AssumedRole",
    "principalId": "00123456ABC7DEF8HIJK",
    "arn": "arn:aws:sts::012345678901:assumed-role/root/myuser",
    "accountId": "012345678901",
    "accessKeyId": "",
    "sessionContext": {
      "sessionIssuer": {
        "type": "Role",
        "principalId": "00123456ABC7DEF8HIJK",
        "arn": "arn:aws:iam::012345678901:role/user",
        "accountId": "012345678901",
        "userName": "user"
      },
      "webIdFederationData": {},
      "attributes": {
        "mfaAuthenticated": "false",
        "creationDate": "2020-10-07T15:51:52Z"
      }
    }
  },
  "eventTime": "2020-10-07T15:52:58Z",
  "eventSource": "airflow.amazonaws.com",
  "eventName": "CreateEnvironment",
  "awsRegion": "us-west-2",
  "sourceIPAddress": "205.251.233.178",
  "userAgent": "PostmanRuntime/7.26.5",
  "errorCode": "AccessDenied",
  "requestParameters": {
    "SourceBucketArn": "arn:aws:s3:::my-bucket",
    "ExecutionRoleArn": "arn:aws:iam::012345678901:role/AirflowTaskRole",
    "AirflowConfigurationOptions": "***",
    "DagS3Path": "sample_dag.py",
    "NetworkConfiguration": {
      "SecurityGroupIds": [
      "sg-01234567890123456"
      ],
      "SubnetIds": [
        "subnet-01234567890123456",
        "subnet-65432112345665431"
      ]
    },
    "Name": "test-cloudtrail"
  },
  "responseElements": {
    "message": "Access denied."
  },
  "requestID": "RequestID",
  "eventID": "EventID",
  "readOnly": false,
  "eventType": "AwsApiCall",
  "recipientAccountId": "012345678901"
}
```

## 接下来做什么？
<a name="monitoring-cloudtrail-next-up"></a>
+ 在[CloudTrail 支持的 AWS 服务和集成中，了解如何为 CloudTrail 日志中收集的事件数据配置其他服务](https://docs.aws.amazon.com//awscloudtrail/latest/userguide/cloudtrail-aws-service-specific-topics.html#cloudtrail-aws-service-specific-topics-integrations)。
+ 要了解如何在向 Amazon S3 存储桶 CloudTrail 发布新日志文件时收到通知，请参阅为其[配置 Amazon SNS 通知](https://docs.aws.amazon.com//awscloudtrail/latest/userguide/getting_notifications_top_level.html)。 CloudTrail

# 访问 Amazon 中的 Airflow 日志 CloudWatch
<a name="monitoring-airflow"></a>

亚马逊 MWAA 可以向亚马逊发送 Apache Airflow 日志。 CloudWatch您可以从一个位置访问多个环境的日志，从而轻松识别 Apache Airflow 任务延迟或工作流程错误，而无需其他第三方工具。需要在适用于 Apache Airflow 的亚马逊托管工作流程控制台上启用 Apache Airflow 日志，才能访问 Apache Airflow DAG 处理、任务、网络服务器、工作人员登录。 CloudWatch

**Contents**
+ [定价](#monitoring-airflow-pricing)
+ [开始前的准备工作](#monitoring-airflow-before)
+ [日志类型](#monitoring-airflow-log-groups)
+ [启用 Apache Airflow 日志](#monitoring-airflow-enable)
+ [访问 Apache Airflow 日志](#monitoring-airflow-view)
+ [示例计划程序日志](#monitoring-airflow-example)
+ [接下来做什么？](#monitoring-airflow-next-up)

## 定价
<a name="monitoring-airflow-pricing"></a>
+ 收取标准 CloudWatch 日志费用。有关更多信息，请参阅 [CloudWatch 定价](https://aws.amazon.com/cloudwatch/pricing/)。

## 开始前的准备工作
<a name="monitoring-airflow-before"></a>
+ 您必须拥有可以访问登录的角色 CloudWatch。有关更多信息，请参阅[访问 Amazon MWAA 环境](access-policies.md)。

## 日志类型
<a name="monitoring-airflow-log-groups"></a>

Amazon MWAA 会为您启用的每个 Airflow 日志选项创建一个日志组，并将日志推送到与环境关联的 CloudWatch 日志组。日志组以 `YourEnvironmentName-LogType` 格式命名。例如，如果环境名为 `Airflow-v202-Public`，则 Apache Airflow 任务日志将发送到 `Airflow-v202-Public-Task`。


| 日志类型 | 说明 | 
| --- | --- | 
|  `YourEnvironmentName-DAGProcessing`  |  DAG 处理器管理器（计划程序中处理 DAG 文件的部分）的日志。  | 
|  `YourEnvironmentName-Scheduler`  |  Airflow 计划程序生成的日志。  | 
|  `YourEnvironmentName-Task`  |  DAG 生成的任务日志。  | 
|  `YourEnvironmentName-WebServer`  |  Airflow Web 界面生成的日志。  | 
|  `YourEnvironmentName-Worker`  |  作为工作流程和 DAG 执行的一部分生成的日志。  | 

## 启用 Apache Airflow 日志
<a name="monitoring-airflow-enable"></a>

您可以启用 `INFO`、`WARNING`、`ERROR` 或 `CRITICAL` 级别的 Apache Airflow 日志。当您选择日志级别时，Amazon MWAA 会发送该级别和所有更高级别的严重性级别的日志。例如，如果您在`INFO`级别启用日志，Amazon MWAA 会向`INFO`日志发送日志`WARNING`、`ERROR`、和`CRITICAL`日志级别。 CloudWatch 

1. 在 Amazon MWAA 控制台上打开[环境页面](https://console.aws.amazon.com/mwaa/home#/environments)。

1. 选择环境。

1. 选择**编辑**。

1. 选择**下一步**。

1. 选择下列一个或多个选项：

   1. 在**监控**窗格上选择 **Airflow 计划程序日志组**。

   1. 在**监控**窗格上选择 **Airflow Web 服务器日志组**。

   1. 在**监控**窗格上选择 **Airflow 工作线程日志组**。

   1. 在**监控**窗格上选择 **Airflow DAG 处理日志组**。

   1. 在**监控**窗格上选择 **Airflow 任务日志组**。

   1. 在 **日志级别**中选择日志级别。

1. 选择**下一步**。

1. 选择**保存**。

## 访问 Apache Airflow 日志
<a name="monitoring-airflow-view"></a>

以下部分介绍如何在控制台中访问 Apache Airflow 日志。 CloudWatch 

1. 在 Amazon MWAA 控制台上打开[环境页面](https://console.aws.amazon.com/mwaa/home#/environments)。

1. 选择环境。

1. 在**监控**窗格中选择一个日志组。

1. 在**日志流**中选择日志。

## 示例计划程序日志
<a name="monitoring-airflow-example"></a>

您可以访问调度工作流程并解析 `dags` 文件夹的计划程序的 Apache Airflow 日志。以下步骤介绍如何在 Amazon MWAA 控制台上打开计划程序的日志组，以及如何在日志控制台上访问 Apache Airflow 日志。 CloudWatch 

**访问 `requirements.txt` 的日志**

1. 在 Amazon MWAA 控制台上打开[环境页面](https://console.aws.amazon.com/mwaa/home#/environments)。

1. 选择环境。

1. 在**监控**窗格上选择 **Airflow 计划程序日志组**。

1. 在**日志流**中选择 `requirements_install_ip` 日志。

1. 请参阅 `/usr/local/airflow/.local/bin` 上环境中安装的程序包列表。例如：

   ```
   Collecting appdirs==1.4.4 (from -r /usr/local/airflow/.local/bin (line 1))
   Downloading https://files.pythonhosted.org/packages/3b/00/2344469e2084fb28kjdsfiuyweb47389789vxbmnbjhsdgf5463acd6cf5e3db69324/appdirs-1.4.4-py2.py3-none-any.whl  
   Collecting astroid==2.4.2 (from -r /usr/local/airflow/.local/bin (line 2))
   ```

1. 查看程序包列表以及其中任何程序包在安装过程中是否遇到错误。如果出现问题，您可能会收到类似以下内容的错误：

   ```
   2021-03-05T14:34:42.731-07:00
   No matching distribution found for LibraryName==1.0.0 (from -r /usr/local/airflow/.local/bin (line 4))
   No matching distribution found for LibraryName==1.0.0 (from -r /usr/local/airflow/.local/bin (line 4))
   ```

## 接下来做什么？
<a name="monitoring-airflow-next-up"></a>
+ 要了解如何配置 CloudWatch 警报，请参阅[使用 Amazon CloudWatch 警报](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)。
+ 要了解如何创建 CloudWatch 仪表板，请参阅[使用 CloudWatch 仪表板](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html)。

# 监控 Amazon MWAA 上的控制面板和警报
<a name="monitoring-dashboard"></a>

您可以在亚马逊 CloudWatch 创建自定义控制面板，并为特定指标添加警报，以监控适用于 Apache Airflow 的亚马逊托管工作流程环境的运行状况。当某个警报位于控制面板上且处于 `ALARM` 状态，则会变成红色，便于主动监控 Amazon MWAA 的运行状况。

Apache Airflow 公开了几个进程的指标，包括 DAG 进程数、DAG 程序包的大小、当前正在运行的任务、任务失败和成功。当您创建环境时，Airflow 会自动将亚马逊 MWAA 环境的指标发送到。 CloudWatch本页介绍如何为 Amazon MWAA 环境中的 CloudWatch Airflow 指标创建运行状况控制面板。

**Contents**
+ [指标](#monitoring-dashboard-metrics)
+ [警报状态概述](#monitoring-dashboard-states)
+ [自定义控制面板和警报示例](#monitoring-dashboard-custom)
  + [关于这些指标](#monitoring-dashboard-custom-about)
  + [关于控制面板](#monitoring-dashboard-custom-about-dash)
  + [使用 AWS 教程](#monitoring-dashboard-tutorials)
  + [使用 CloudFormation](#monitoring-dashboard-cfn)
+ [删除指标和控制面板](#monitoring-dashboard-delete)
+ [接下来做什么？](#monitoring-dashboard-next-up)

## 指标
<a name="monitoring-dashboard-metrics"></a>

您可以为 Apache Airflow 版本的任何可用指标创建自定义控制面板和警报。每个指标都对应一个 Apache Airflow 关键性能指标（KPI）。要访问指标列表，请参阅：
+ [中的 Apache Airflow 环境指标 CloudWatch](access-metrics-cw.md)

## 警报状态概述
<a name="monitoring-dashboard-states"></a>

指标告警可能具有以下几种状态：
+ `OK` – 指标或表达式在定义的阈值范围内。
+ `ALARM` – 指标或表达式超出定义的阈值。
+ `INSUFFICIENT_DATA`（数据不足） – 告警刚刚启动，指标不可用，或者指标没有足够的数据以确定告警状态。

## 自定义控制面板和警报示例
<a name="monitoring-dashboard-custom"></a>

您可以构建自定义监控控制面板，显示 Amazon MWAA 环境所选指标的图表。

### 关于这些指标
<a name="monitoring-dashboard-custom-about"></a>

以下列表描述了通过本节中的教程和模板定义在自定义控制面板中创建的每个指标。
+ *QueuedTasks*-处于队列状态的任务数。对应于 `executor.queued_tasks` Apache Airflow 指标。
+ *TasksPending*-执行器中待处理的任务数。对应于 `scheduler.tasks.pending` Apache Airflow 指标。
**注意**  
不适用于 Apache Airflow v2.2 及更高版本。
+ *RunningTasks*-在执行器中运行的任务数。对应于 `executor.running_tasks` Apache Airflow 指标。
+ *SchedulerHeartbeat*-Apache Airflow 在调度程序作业中执行的签到次数。与 `scheduler_heartbeat` Apache Airflow 指标相对应。
+ *TotalParseTime*-一次扫描和导入所有 DAG 文件所花费的秒数。对应于 `dag_processing.total_parse_time` Apache Airflow 指标。

### 关于控制面板
<a name="monitoring-dashboard-custom-about-dash"></a>

下图显示了根据本节中的教程和模板定义创建的监控面板。

![\[此图描述了在 Amazon MWAA 控制台上哪里可以找到私有网络选项。\]](http://docs.aws.amazon.com/zh_cn/mwaa/latest/userguide/images/cw-dashboard.png)


### 使用 AWS 教程
<a name="monitoring-dashboard-tutorials"></a>

您可以使用以下 AWS 教程为当前部署的任何 Amazon MWAA 环境自动创建运行状况控制面板。它还会针对所有 Amazon MWAA 环境中的不健康工作人员和计划程序心跳故障创建 CloudWatch 警报。
+ [CloudWatch 亚马逊 MWAA 控制面板自动化](https://github.com/aws-samples/mwaa-dashboard)

### 使用 CloudFormation
<a name="monitoring-dashboard-cfn"></a>

您可以使用本节中的 CloudFormation 模板定义在中创建监控面板 CloudWatch，然后在 CloudWatch 控制台上添加警报，以便在指标超过特定阈值时接收通知。要使用此模板定义创建堆栈，请参阅在[CloudFormation 控制台上创建堆栈](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/cfn-console-create-stack.html)。要向控制面板添加警报，请参阅[使用警报](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)。

```
AWSTemplateFormatVersion: "2010-09-09"
Description: Creates MWAA Cloudwatch Dashboard
Parameters:
  DashboardName:
    Description: Enter the name of the CloudWatch Dashboard
    Type: String
  EnvironmentName:
    Description: Enter the name of the MWAA Environment
    Type: String    
Resources:
  BasicDashboard:
    Type: AWS::CloudWatch::Dashboard
    Properties:
      DashboardName: !Ref DashboardName
      DashboardBody:
        Fn::Sub: '{
              "widgets": [
                  {
                      "type": "metric",
                      "x": 0,
                      "y": 0,
                      "width": 12,
                      "height": 6,
                      "properties": {
                          "view": "timeSeries",
                          "stacked": true,
                          "metrics": [
                              [
                                  "AmazonMWAA",
                                  "QueuedTasks",
                                  "Function",
                                  "Executor",
                                  "Environment",
                                  "${EnvironmentName}"
                              ]
                          ],
                          "region": "${AWS::Region}",
                          "title": "QueuedTasks ${EnvironmentName}",
                          "period": 300
                      }
                  },
                  {
                      "type": "metric",
                      "x": 0,
                      "y": 6,
                      "width": 12,
                      "height": 6,
                      "properties": {
                          "view": "timeSeries",
                          "stacked": true,
                          "metrics": [
                              [
                                  "AmazonMWAA",
                                  "RunningTasks",
                                  "Function",
                                  "Executor",
                                  "Environment",
                                  "${EnvironmentName}"
                              ]
                          ],
                          "region": "${AWS::Region}",
                          "title": "RunningTasks ${EnvironmentName}",
                          "period": 300
                      }
                  },
                  {
                      "type": "metric",
                      "x": 12,
                      "y": 6,
                      "width": 12,
                      "height": 6,
                      "properties": {
                          "view": "timeSeries",
                          "stacked": true,
                          "metrics": [
                              [
                                  "AmazonMWAA",
                                  "SchedulerHeartbeat",
                                  "Function",
                                  "Scheduler",
                                  "Environment",
                                  "${EnvironmentName}"
                              ]
                          ],
                          "region": "${AWS::Region}",
                          "title": "SchedulerHeartbeat ${EnvironmentName}",
                          "period": 300
                      }
                  },
                  {
                      "type": "metric",
                      "x": 12,
                      "y": 0,
                      "width": 12,
                      "height": 6,
                      "properties": {
                          "view": "timeSeries",
                          "stacked": true,
                          "metrics": [
                              [
                                  "AmazonMWAA",
                                  "TasksPending",
                                  "Function",
                                  "Scheduler",
                                  "Environment",
                                  "${EnvironmentName}"
                              ]
                          ],
                          "region": "${AWS::Region}",
                          "title": "TasksPending ${EnvironmentName}",
                          "period": 300
                      }
                  },
                  {
                      "type": "metric",
                      "x": 0,
                      "y": 12,
                      "width": 24,
                      "height": 6,
                      "properties": {
                          "view": "timeSeries",
                          "stacked": true,
                          "region": "${AWS::Region}",
                          "metrics": [
                              [
                                  "AmazonMWAA",
                                  "TotalParseTime",
                                  "Function",
                                  "DAG Processing",
                                  "Environment",
                                  "${EnvironmentName}"
                              ]
                          ],
                          "title": "TotalParseTime  ${EnvironmentName}",
                          "period": 300
                      }
                  }
              ]
          }'
```

## 删除指标和控制面板
<a name="monitoring-dashboard-delete"></a>

如果您删除 Amazon MWAA 环境，相应的控制面板也会被删除。 CloudWatch 指标存储十五 (15) 个月，无法删除。 CloudWatch 控制台将指标的搜索限制在上次采集指标后的两 (2) 周内，以确保显示您的 Amazon MWAA 环境的最新实例。要了解更多信息，请参阅 [Amazon CloudWatch FAQs](https://aws.amazon.com/cloudwatch/faqs/)。

## 接下来做什么？
<a name="monitoring-dashboard-next-up"></a>
+ 了解如何创建 DAG 来查询您的环境的 Amazon Aurora PostgreSQL 元数据数据库并将自定义指标发布到中。 CloudWatch [使用 DAG 在 CloudWatch 中编写自定义指标](samples-custom-metrics.md)

# 中的 Apache Airflow 环境指标 CloudWatch
<a name="access-metrics-cw"></a>

Apache Airflow v2 和 v3 已经设置为收集适用于 Apache Airflow 的亚马逊托管工作流程环境的 [StatSD](https://github.com/etsy/statsd) 指标并将其发送到亚马逊。 CloudWatchApache Airflow 发送的指标的完整列表可在*《Apache Airflow 参考指南》*的 [指标](https://airflow.apache.org/docs/apache-airflow/stable/administration-and-deployment/logging-monitoring/metrics.html)页面上找到。本页介绍了中可用的 Apache Airflow 指标以及如何在控制台 CloudWatch 中访问指标。 CloudWatch 

**Contents**
+ [术语](#access-metrics-cw-terms)
+ [Dimensions](#metrics-dimensions)
+ [在 CloudWatch 控制台中访问指标](#access-metrics-cw-console)
+ [Apache Airflow 指标可用于 CloudWatch](#available-metrics-cw)
  + [Apache Airflow 计数器](#counters-metrics)
  + [Apache Airflow 计](#gauges-metrics)
  + [Apache Airflow 计时器](#timers-metrics)
+ [选择要报告的指标](#choosing-metrics)
+ [接下来做什么？](#mwaa-metrics202-next-up)

## 术语
<a name="access-metrics-cw-terms"></a>

**命名空间**  
命名空间是 AWS 服务 CloudWatch 指标的容器。对于Amazon MWAA，命名空间为 *AmazonMWAA*。

**CloudWatch 指标**  
 CloudWatch 指标表示特定于的一组按时间顺序排列的数据点。 CloudWatch

**Apache Airflow 指标**  
特定于 Apache Airflow 的[指标](https://airflow.apache.org/docs/apache-airflow/stable/administration-and-deployment/logging-monitoring/metrics.html )。

**维度**  
维度是作为指标标识一部分的 name/value 配对。

**单位**  
所有统计数据都有度量单位。对于 Amazon MWAA，单位包括*计数*、*秒*和*毫秒*。对于 Amazon MWAA，单位是根据原始 Airflow 指标中的单位设置的。

## Dimensions
<a name="metrics-dimensions"></a>

本节介绍中 Apache Airflow 指标的 CloudWatch *维度*分组。 CloudWatch


| 维度 | 说明 | 
| --- | --- | 
|  DAG  |  表示特定的 Apache Airflow DAG 名称。  | 
|  DAG 文件名  |  表示特定的 Apache Airflow DAG 文件名称。  | 
|  函数  |  此维度用于改进中的指标分组 CloudWatch。  | 
|  任务  |  表示计划程序运行的 Apache Airflow 任务。始终具有 `Job` 的值。  | 
|  运算符  |  表示特定的 Apache Airflow 运算符。  | 
|  池  |  表示特定的 Apache Airflow 工作线程池。  | 
|  Task  |  表示特定的 Apache Airflow 任务。  | 
|  HostName  |  表示正在运行的特定的 Apache Airflow 进程的主机名。  | 

## 在 CloudWatch 控制台中访问指标
<a name="access-metrics-cw-console"></a>

本节介绍如何访问特定 DAG 中的 CloudWatch 性能指标。

**访问维度的性能指标**

1. 在 CloudWatch 控制台上打开 [“指标” 页面](https://console.aws.amazon.com/cloudwatch/home#metricsV2:graph=~())。

1. 选择你的 AWS 区域。

1. 选择 **AmazonMWAA** 命名空间。

1. 在**所有指标**选项卡中，选择一个维度。例如，*DAG、环境*。

1. 为维 CloudWatch 度选择一个指标。例如，*TaskInstanceSuccesses* 或 *TaskInstanceDuration*。选择**绘制所有搜索结果的图表**。

1. 选择**图表化指标**选项卡可访问 Apache Airflow 指标的性能统计信息，例如 *DAG、环境、任务*。

## Apache Airflow 指标可用于 CloudWatch
<a name="available-metrics-cw"></a>

本节介绍发送到的 Apache Airflow 指标和维度。 CloudWatch

### Apache Airflow 计数器
<a name="counters-metrics"></a>

本节中的 Apache Airflow 指标包含有关 [Apache Airflow *计数器*](https://airflow.apache.org/docs/apache-airflow/stable/administration-and-deployment/logging-monitoring/metrics.html#counters)的数据。


| CloudWatch 指标 | Apache Airflow 指标 | 单位 | 维度 | 
| --- | --- | --- | --- | 
|  SLAMissed  仅适用于 Apache Airflow v2.4.3 到 v2.10.3。   |  sla\$1missed  |  计数  |  函数，计划程序  | 
|  失败了 SLACallback  仅适用于 Apache Airflow v2.4.3 到 v2.10.3。   |  sla\$1callback\$1notification\$1failure  |  计数  |  函数，计划程序  | 
|  更新  适用于 Apache Airflow v2.6.3 及更高版本。   |  dataset.updates  |  计数  |  函数，计划程序  | 
|  孤立  适用于 Apache Airflow v2.6.3 及更高版本。   |  dataset.orphaned  |  计数  |  函数，计划程序  | 
|  FailedCeleryTaskExecution  适用于 Apache Airflow v2.4.3 及更高版本。   |  celery.execute\$1command.failure  |  计数  |  函数，Celery  | 
|  FilePathQueueUpdateCount  适用于 Apache Airflow v2.6.3 及更高版本。   |  dag\$1processing.file\$1path\$1queue\$1update\$1count  |  计数  |  函数，计划程序  | 
|  CriticalSectionBusy  |  scheduler.critical\$1section\$1busy  |  计数  |  函数，计划程序  | 
|  DagBagSize  |  dagbag\$1size  |  计数  |  函数，DAG 处理  | 
|  DagCallbackExceptions  |  dag.callback\$1exceptions  |  计数  |  DAG，全部  | 
|  失败的SLAEmail尝试  适用于 Apache Airflow v3.0.6 及更高版本。   |  sla\$1email\$1notification\$1failure  |  计数  |  函数，计划程序  | 
|  TaskInstanceFinished  |  ti.finish.\$1dag\$1id\$1.\$1task\$1id\$1.\$1state\$1  |  计数  |  DAG, \$1dag\$1id\$1 任务，\$1task\$1id\$1 状态，\$1state\$1  | 
|  JobEnd  |  \$1job\$1name\$1 \$1end  |  计数  |  任务，\$1job\$1name\$1  | 
|  JobHeartbeatFailure  |  \$1job\$1name\$1\$1heartbeat\$1failure  |  计数  |  任务，\$1job\$1name\$1  | 
|  JobStart  |  \$1job\$1name\$1\$1start  |  计数  |  任务，\$1job\$1name\$1  | 
|  ManagerStalls  |  dag\$1processing.manager\$1stalls  |  计数  |  函数，DAG 处理  | 
|  OperatorFailures  |  operator\$1failures\$1\$1operator\$1name\$1  |  计数  |  运算符，\$1operator\$1name\$1  | 
|  OperatorSuccesses  |  operator\$1successes\$1\$1operator\$1name\$1  |  计数  |  运算符，\$1operator\$1name\$1  | 
|  OtherCallbackCount  在 Apache Airflow v2.6.3 及更高版本中可用。   |  dag\$1processing.other\$1callback\$1count  |  计数  |  函数，计划程序  | 
|  进程  |  dag\$1processing 进程  |  计数  |  函数，DAG 处理  | 
|  SchedulerHeartbeat  |  scheduler\$1heartbeat  |  计数  |  函数，计划程序  | 
|  StartedTaskInstances  |  ti.start.\$1dag\$1id\$1.\$1task\$1id\$1  |  计数  |  DAG，全部 任务，全部  | 
|  SlaCallbackCount  |  dag\$1processing.sla\$1callback\$1count  适用于 Apache Airflow v2.6.3 及更高版本。   |  计数  |  函数，计划程序  | 
|  TasksKilledExternally  |  scheduler.tasks.killed\$1externally  |  计数  |  函数，计划程序  | 
|  TaskTimeoutError  |  celery.task\$1timeout\$1error  |  计数  |  函数，Celery  | 
|  TaskInstanceCreatedUsingOperator  |  task\$1instance\$1created-\$1operator\$1name\$1  |  计数  |  运算符，\$1operator\$1name\$1  | 
|  TaskInstancePreviouslySucceeded  |  previously\$1succeeded  |  计数  |  DAG，全部 任务，全部  | 
|  TaskInstanceFailures  |  ti\$1failures  |  计数  |  DAG，全部 任务，全部  | 
|  TaskInstanceSuccesses  |  ti\$1successes  |  计数  |  DAG，全部 任务，全部  | 
|  TaskRemovedFromDAG  |  task\$1removed\$1from\$1dag.\$1dag\$1id\$1  |  计数  |  DAG, \$1dag\$1id\$1  | 
|  TaskRestoredToDAG  |  task\$1restored\$1to\$1dag.\$1dag\$1id\$1  |  计数  |  DAG, \$1dag\$1id\$1  | 
|  TriggersSucceeded  适用于 Apache Airflow v2.7.2 及更高版本。   |  triggers.succeeded  |  计数  |  函数，触发  | 
|  TriggersFailed  适用于 Apache Airflow v2.7.2 及更高版本。   |  triggers.failed  |  计数  |  函数，触发  | 
|  TriggersBlockedMainThread  适用于 Apache Airflow v2.7.2 及更高版本。   |  triggers.blocked\$1main\$1thread  |  计数  |  函数，触发  | 
|  TriggerHeartbeat  适用于 Apache Airflow v2.8.1 及更高版本。   |  triggerer\$1heartbeat  |  计数  |  函数、触发器  | 
|  TaskInstanceCreatedUsingOperator  |  airflow.task\$1instance\$1created\$1`{operator_name}`  适用于 Apache Airflow v2.7.2 及更高版本。   |  计数  |  运算符，`{operator_name}`  | 
|  ZombiesKilled  |  zombies\$1killed  |  计数  |  DAG，全部 任务，全部  | 

### Apache Airflow 计
<a name="gauges-metrics"></a>

本节中的 Apache Airflow 指标包含有关 [Apache Airflow *计*](https://airflow.apache.org/docs/apache-airflow/stable/administration-and-deployment/logging-monitoring/metrics.html#gauges)的数据。


| CloudWatch 指标 | Apache Airflow 指标 | 单位 | 维度 | 
| --- | --- | --- | --- | 
|  DAGFileRefreshError  |  dag\$1file\$1refresh\$1error  |  计数  |  函数，DAG 处理  | 
|  ImportErrors  |  dag\$1processing.import\$1errors  |  计数  |  函数，DAG 处理  | 
|  ExceptionFailures  |  smart\$1sensor\$1operator.exception\$1failures  |  计数  |  函数，智能传感器运算符  | 
|  ExecutedTasks  |  smart\$1sensor\$1operator.executed\$1tasks  |  计数  |  函数，智能传感器运算符  | 
|  InfraFailures  |  smart\$1sensor\$1operator.infailes  |  计数  |  函数，智能传感器运算符  | 
|  LoadedTasks  |  smart\$1sensor\$1operator.loaded\$1tasks  |  计数  |  函数，智能传感器运算符  | 
|  TotalParseTime  |  dag\$1processing.total\$1parse\$1time  |  秒  |  函数，DAG 处理  | 
|  TriggeredDagRuns  在 Apache Airflow v2.6.3 及更高版本中可用。   |  dataset.triggered\$1dagruns  |  计数  |  函数，计划程序  | 
|  TriggersRunning  在 Apache Airflow v2.7.2 及更高版本中可用。   |  triggers.runn。 *\$1hostname\$1*  |  计数  |  函数，触发 HostName, *\$1hostname\$1*  | 
|  PoolDeferredSlots  在 Apache Airflow v2.7.2 及更高版本中可用。   |  pool.deferred\$1slots.`{pool_name}`  |  计数  |  池，\$1pool\$1name\$1  | 
|  DAGFileProcessingLastRunSecondsAgo  |  dag\$1processing.last\$1run.seconds\$1ago.\$1dag\$1filename\$1  |  秒  |  DAG 文件名，\$1dag\$1filename\$1  | 
|  OpenSlots  |  executor.open\$1slots  |  计数  |  函数，执行程序  | 
|  OrphanedTasksAdopted  |  scheduler.orphaned\$1tasks.adopted  |  计数  |  函数，计划程序  | 
|  OrphanedTasksCleared  |  scheduler.orphaned\$1tasks.cleared  |  计数  |  函数，计划程序  | 
|  PokedExceptions  |  smart\$1sensor\$1operator.poked\$1exception  |  计数  |  函数，智能传感器运算符  | 
|  PokedSuccess  |  smart\$1sensor\$1operator.poked\$1success  |  计数  |  函数，智能传感器运算符  | 
|  PokedTasks  |  smart\$1sensor\$1operator.poked\$1tasks  |  计数  |  函数，智能传感器运算符  | 
|  PoolFailures  |  pool.open\$1slots.\$1pool\$1name\$1  |  计数  |  池，\$1pool\$1name\$1  | 
|  PoolStarvingTasks  |  pool.starving\$1tasks.\$1pool\$1name\$1  |  计数  |  池，\$1pool\$1name\$1  | 
|  PoolOpenSlots  |  pool.open\$1slots.\$1pool\$1name\$1  |  计数  |  池，\$1pool\$1name\$1  | 
|  PoolQueuedSlots  |  pool.queued\$1slots.\$1pool\$1name\$1  |  计数  |  池，\$1pool\$1name\$1  | 
|  PoolRunningSlots  |  pool.running\$1slots.\$1pool\$1name\$1  |  计数  |  池，\$1pool\$1name\$1  | 
|  ProcessorTimeouts  |  dag\$1processing.processor\$1timeouts  |  计数  |  函数，DAG 处理  | 
|  QueuedTasks  |  executor.queued\$1tasks  |  计数  |  函数，执行程序  | 
|  RunningTasks  |  executor.running\$1tasks  |  计数  |  函数，执行程序  | 
|  TasksExecutable  |  scheduler.tasks.executable  |  计数  |  函数，计划程序  | 
|  TasksPending  不适用于 Apache Airflow v2.2 及更高版本。   |  scheduler.tasks.pending  |  计数  |  函数，计划程序  | 
|  TasksRunning  |  scheduler.tasks.running  |  计数  |  函数，计划程序  | 
|  TasksStarving  |  scheduler.tasks.starving  |  计数  |  函数，计划程序  | 
|  TasksWithoutDagRun  |  scheduler.tasks.without\$1dagrun  |  计数  |  函数，计划程序  | 
|  DAGFileProcessingLastNumOfDbQueries  在 Apache Airflow v2.10.1 及更高版本中可用。  |  dag\$1processing.last\$1num\$1of\$1db\$1queries.\$1dag\$1filename\$1  |  计数  |  DAG 文件名，\$1dag\$1filename\$1  | 
|  PoolScheduledSlots  在 Apache Airflow v2.10.1 及更高版本中可用。   |  pool.scheduled\$1slots.\$1pool\$1name\$1  |  计数  |  池，\$1pool\$1name\$1  | 
|  TaskCpuUsage  在 Apache Airflow v2.10.1 及更高版本中可用。  |  cpu.usage.\$1dag\$1id\$1.\$1task\$1id\$1  |  百分比  |  DAG, \$1dag\$1id\$1 任务，\$1task\$1id\$1  | 
|  TaskMemoryUsage  在 Apache Airflow v2.10.1 及更高版本中可用。  |  mem.usage.\$1dag\$1id\$1.\$1task\$1id\$1  |  百分比  |  DAG, \$1dag\$1id\$1 任务，\$1task\$1id\$1  | 

### Apache Airflow 计时器
<a name="timers-metrics"></a>

本节中的 Apache Airflow 指标包含有关 [Apache Airflow *计时器*](https://airflow.apache.org/docs/apache-airflow/stable/administration-and-deployment/logging-monitoring/metrics.html#timers)的数据。


| CloudWatch 指标 | Apache Airflow 指标 | 单位 | 维度 | 
| --- | --- | --- | --- | 
|  收集 DBDags  |  collect\$1db\$1dags  |  毫秒  |  函数，DAG 处理  | 
|  CriticalSectionDuration  |  scheduler.critical\$1section\$1duration  |  毫秒  |  函数，计划程序  | 
|  CriticalSectionQueryDuration  适用于 Apache Airflow v2.5.1 及更高版本。   |  scheduler.critical\$1section\$1query\$1duration  |  毫秒  |  函数，计划程序  | 
|  DAGDependency查看  |  dagrun.dependency-check.\$1dag\$1id\$1  |  毫秒  |  DAG, \$1dag\$1id\$1  | 
|  DAGDuration失败了  |  dagrun.duration.failed.\$1dag\$1id\$1  |  毫秒  |  DAG, \$1dag\$1id\$1  | 
|  DAGDuration成功  |  dagrun.duration.success.\$1dag\$1id\$1  |  毫秒  |  DAG, \$1dag\$1id\$1  | 
|  DAGFileProcessingLastDuration  |  dag\$1processing.last\$1duration.\$1dag\$1filename\$1  |  秒  |  DAG 文件名，\$1dag\$1filename\$1  | 
|  DAGSchedule延迟  |  dagrun.schedule\$1delay.\$1dag\$1id\$1  |  毫秒  |  DAG, \$1dag\$1id\$1  | 
|  FirstTaskSchedulingDelay  |  dagrun.\$1dag\$1id\$1.first\$1task\$1scheduling\$1delay  |  毫秒  |  DAG, \$1dag\$1id\$1  | 
|  SchedulerLoopDuration  适用于 Apache Airflow v2.5.1 及更高版本。   |  scheduler.scheduler\$1loop\$1duration  |  毫秒  |  函数，计划程序  | 
|  TaskInstanceDuration  |  dag.\$1dag\$1id\$1.\$1task\$1id\$1.duration  |  毫秒  |  DAG, \$1dag\$1id\$1 任务，\$1task\$1id\$1  | 
|  TaskInstanceQueuedDuration  |  dag.`{dag_id}`.`{task_id}`.queued\$1duration  适用于 Apache Airflow v2.7.2 及更高版本。   |  毫秒  |  DAG, \$1dag\$1id\$1 任务，\$1task\$1id\$1  | 
|  TaskInstanceScheduledDuration  适用于 Apache Airflow v2.7.2 及更高版本。   |  dag.`{dag_id}`.`{task_id}`.scheduled\$1duration  |  毫秒  |  DAG, \$1dag\$1id\$1 任务，\$1task\$1id\$1  | 

## 选择要报告的指标
<a name="choosing-metrics"></a>

[您可以使用以下 Amazon MWAA 配置选项来选择 CloudWatch向哪些 Apache Airflow 发送或屏蔽的 Apache Airflow 指标：](configuring-env-variables.md)
+ **`metrics.metrics_allow_list`**— 逗号分隔的前缀列表，可用于选择您的环境向哪些指标发送到 CloudWatch 哪些指标。如果您希望 Apache Airflow 不发送所有可用指标，而是选择元素的子集，请使用此选项。例如 `scheduler,executor,dagrun`。
+ **`metrics.metrics_block_list`** — 以逗号分隔的前缀列表，用于筛选出以列表元素开头的指标。例如 `scheduler,executor,dagrun`。

如果同时配置 `metrics.metrics_allow_list` 和 `metrics.metrics_block_list`，Apache Airflow 将忽略 `metrics.metrics_block_list`。如果您配置 `metrics.metrics_block_list` 但未配置 `metrics.metrics_allow_list`，Apache Airflow 会过滤掉您在 `metrics.metrics_block_list` 中指定的元素。

**注意**  
`metrics.metrics_allow_list` 和 `metrics.metrics_block_list` 配置选项仅适用于 Apache Airflow v2.6.3 及更高版本。对于先前版本的 Apache Airflow，请改用 `metrics.statsd_allow_list` 和 `metrics.statsd_block_list`。

## 接下来做什么？
<a name="mwaa-metrics202-next-up"></a>
+ 浏览用于发布环境运行状况指标的 Amazon MWAA API 操作，网址为。[PublishMetrics](https://docs.aws.amazon.com/mwaa/latest/API/API_PublishMetrics.html)

# Amazon MWAA 的容器、队列和数据库指标
<a name="accessing-metrics-cw-container-queue-db"></a>

除了 Apache Airflow 指标外，您还可以 CloudWatch使用监控适用于 Apache Airflow 环境的亚马逊托管工作流程的底层组件，它收集原始数据并将数据处理为可读的近乎实时的指标。借助这些环境指标，您可以更清楚地了解关键性能指标，从而帮助您适当调整环境规模并调试工作流程中的问题。这些指标适用于 Amazon MWAA 上支持的所有 Apache Airflow 版本。



Amazon MWAA 将为每个 Amazon Elastic Container Service（Amazon ECS）容器和 Amazon Aurora PostgreSQL 实例提供 CPU 和内存使用率，提供 Amazon Simple Queue Service（Amazon SQS）指标指示消息数量和最旧消息存放时间，提供 Amazon Relational Database Service（Amazon RDS）指标指示数据库连接、队列磁盘深度、写入操作、延迟和吞吐量，以及提供 Amazon RDS 代理指标。这些指标还包括基础工作线程、额外工作线程、计划程序和 Web 服务器的数量。

这些统计数据会保存 15 个月，从而使您能够访问历史信息，并能够更好地了解计划失败的原因，并对潜在问题进行故障排除。您还可以设置警报来监控特定的阈值，并在达到那些阈值时发送通知或执行操作。有关更多信息，请参阅 A [mazon CloudWatch 用户指南](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/)。

**Topics**
+ [术语](#accessing-metrics-cw-container-queue-db-terms)
+ [Dimensions](#accessing-metrics-cw-container-queue-db-dimensions)
+ [在 CloudWatch 控制台中访问指标](#accessing-metrics-cw-container-queue-db-console)
+ [指标的列表](#accessing-metrics-cw-container-queue-db-list)

## 术语
<a name="accessing-metrics-cw-container-queue-db-terms"></a>

**命名空间**  
命名空间是 AWS 服务 CloudWatch 指标的容器。Amazon MWAA 的命名空间为 `AWS/MWAA`。

**CloudWatch 指标**  
 CloudWatch 指标表示特定于的一组按时间顺序排列的数据点。 CloudWatch

**维度**  
维度是作为指标标识一部分的 name/value 配对。

**单位**  
所有统计数据都有度量单位。Amazon MWAA 的单位包括数量*计数*。

## Dimensions
<a name="accessing-metrics-cw-container-queue-db-dimensions"></a>

本节介绍中亚马逊 MWAA 指标的 CloudWatch 维度分组。 CloudWatch


| 维度 | 说明 | 
| --- | --- | 
|  Cluster  |  Amazon MWAA 环境用于运行 Apache Airflow 组件的最少三个 Amazon ECS 容器的指标：调度器、Worker 节点和 Web 服务器。  | 
|  队列  |  Amazon SQS 队列的指标，用于将计划程序与工作线程分离。当工作线程阅读消息时，它们被视为机上信息，不适用于其他工作线程。如果消息在 12 小时可见性超时之前未被删除，则这些消息可供其他工作线程读取。  | 
|  数据库  |  Amazon MWAA 使用的 Aurora 集群的指标。这包括主数据库实例和支持读取操作的只读副本的指标。Amazon MWAA 同时发布 READER 和 WRITER 实例的数据库指标。  | 

## 在 CloudWatch 控制台中访问指标
<a name="accessing-metrics-cw-container-queue-db-console"></a>

本节介绍如何在中访问您的亚马逊 MWAA 指标。 CloudWatch

**访问维度的性能指标**

1. 在 CloudWatch 控制台上打开 [“指标” 页面](https://console.aws.amazon.com/cloudwatch/home#metricsV2:graph=~())。

1. 选择你的 AWS 区域。

1. 选择 **AWS/MWAA** 命名空间。

1. 在**所有指标**选项卡中，选择一个维度。例如，**集群**。

1. 为维 CloudWatch 度选择一个指标。例如，*NumSchedulers* 或 *CPUUtilization*。然后，选择**绘制所有搜索结果的图表**。

1. 选择**图表化指标**选项卡以访问性能指标。

## 指标的列表
<a name="accessing-metrics-cw-container-queue-db-list"></a>

下表列出了 Amazon MWAA 的集群、队列和数据库服务指标。要访问直接从 Amazon ECS、Amazon SQS 或 Amazon RDS 发布的指标的描述，请选择相应的文档链接。

**Topics**
+ [集群指标](#container-list)
+ [数据库指标](#db-list)
+ [队列指标](#queue-list)
+ [应用程序负载均衡器指标](#alb-list)

### 集群指标
<a name="container-list"></a>

以下指标适用于每个计划程序、基础工作线程、其他工作线程和 Web 服务器。有关每个集群指标的更多信息和描述，请参阅*《Amazon ECS 开发人员指南》*中的[可用指标和维度](https://docs.aws.amazon.com/AmazonECS/latest/developerguide/cloudwatch-metrics.html#available_cloudwatch_metrics)。


| 命名空间 | 指标 | 单位 | 
| --- | --- | --- | 
|  `AWS/MWAA`  |  `CPUUtilization`  |  百分比  | 
|  `AWS/MWAA`  |  `MemoryUtilization`  |  百分比  | 

#### 评估额外工作线程和 Web 服务器容器的数量
<a name="additional-worker-scheduler-sample-count"></a>

您可以按以下过程所述，使用**集群**维度中提供的组件指标来评估环境在给定时间点正在使用的额外工作线程或 Web 服务器数量。为此，您可以绘制**CPUUtilization**或**MemoryUtilization**指标的图表，并将统计类型设置为 “**样本数**”。结果值是 `AdditionalWorker` 组件的 `RUNNING` 任务总数。了解环境使用的额外工作线程实例数量，有助您衡量环境的扩缩情况，并有利于您优化额外工作线程的数量。

------
#### [ Workers ]

**要评估额外工作人员的人数，请使用 AWS 管理控制台**

1. 选择 **AWS/MWAA** 命名空间。

1. 在**所有指标**选项卡中，选择**集群**维度。

1. 在 “**聚**类” 维度中 **AdditionalWorker**，为选择**CPUUtilization**或**MemoryUtilization**指标。

1. 在**绘成图表的指标**选项卡上，将**周期**设置为 **1 分钟**，将**统计数据**更改为**样本数**。

------
#### [ webservers ]

**要评估其他 Web 服务器的数量，请使用 AWS 管理控制台**

1. 选择 **AWS/MWAA** 命名空间。

1. 在**所有指标**选项卡中，选择**集群**维度。

1. 在 “**聚**类” 维度中 **AdditionalWebservers**，为选择**CPUUtilization**或**MemoryUtilization**指标。

1. 在**绘成图表的指标**选项卡上，将**周期**设置为 **1 分钟**，将**统计数据**更改为**样本数**。

------

有关更多信息，请参阅*《Amazon Elastic Container Service 开发人员指南》*中的[服务 `RUNNING` 任务数](https://docs.aws.amazon.com/AmazonECS/latest/developerguide/cloudwatch-metrics.html#cw_running_task_count)。

### 数据库指标
<a name="db-list"></a>

以下指标适用于与 Amazon MWAA 环境关联的每个数据库实例。


| 命名空间 | 指标 | 单位 | 
| --- | --- | --- | 
|  `AWS/MWAA`  |  `CPUUtilization`  |  百分比  | 
|  `AWS/MWAA`  |  `DatabaseConnections`  |  计数  | 
|  `AWS/MWAA`  |  `DiskQueueDepth`  |  计数  | 
|  `AWS/MWAA`  |  `FreeableMemory`  |  字节  | 
|  `AWS/MWAA`  |  `VolumeWriteIOPS`  |  每 5 分钟计数  | 
|  `AWS/MWAA`  |  `WriteIOPS`  |  每秒计数  | 
|  `AWS/MWAA`  |  `WriteLatency`  |  秒  | 
|  `AWS/MWAA`  |  `WriteThroughput`  |  每秒字节数  | 

### 队列指标
<a name="queue-list"></a>

有关以下队列指标的单位和描述的更多信息，请参阅《[亚马逊*简单队列服务开发者指南》中的 Ama* zon SQS 可用 CloudWatch 指标](https://docs.aws.amazon.com/AWSSimpleQueueService/latest/SQSDeveloperGuide/sqs-available-cloudwatch-metrics.html)。


| 命名空间 | 指标 | 单位 | 
| --- | --- | --- | 
|  `AWS/MWAA`  |  `ApproximateAgeOfOldestTask`  |  秒  | 
|  `AWS/MWAA`  |  `RunningTasks`  |  计数  | 
|  `AWS/MWAA`  |  `QueuedTasks`  |  计数  | 

### 应用程序负载均衡器指标
<a name="alb-list"></a>

应用程序负载均衡器指标适用于在环境中运行的 Web 服务器。Amazon MWAA 根据流量大小，使用这些指标来扩展 Web 服务器。有关以下负载均衡器指标的单位和描述的更多信息，请参阅《[应用程序负载均衡器*用户指南》中的 Application Load Bal* ancer CloudWatch 指标](https://docs.aws.amazon.com/elasticloadbalancing/latest/application/load-balancer-cloudwatch-metrics.html)。


| 命名空间 | 指标 | 单位 | 
| --- | --- | --- | 
|  `AWS/MWAA`  |  `ActiveConnectionCount`  |  计数  | 