

# 监控 Amazon ECS 托管实例
<a name="monitoring-managed-instances"></a>

监控是维护 Amazon ECS 托管实例工作负载的可靠性、可用性和性能的一个重要组成部分。AWS 提供了多种工具和服务来帮助您监控容器化应用程序和基础设施。

## Container Insights 监控
<a name="container-insights-monitoring"></a>

CloudWatch Container Insights 为您的容器化应用程序和微服务提供全面监控。Container Insights 会从运行在 Amazon ECS 托管实例上的容器化应用程序和微服务收集、聚合和汇总指标和日志。

Container Insights 在集群、服务和任务级别收集指标，提供对以下内容的可见性：
+ CPU 和内存利用率
+ 网络性能指标
+ 存储使用率
+ 任务和服务性能

这些指标可在 CloudWatch 控制面板中获得，可用于创建警报和对性能问题的自动响应。Container Insights 还提供增强的监控功能，帮助您快速识别和解决问题。

**注意**  
Container Insights 需要额外付费。有关定价的更多信息，请参阅 [CloudWatch 定价](https://aws.amazon.com/cloudwatch/pricing/)。

## GPU 监控
<a name="gpu-monitoring-managed-instances"></a>

对于运行支持 NVIDIA GPU 的 Amazon EC2 实例类型的 Amazon ECS 托管实例，具有增强型可观测性的 Container Insights 会从 NVIDIA Data Center GPU Manager（DCGM）收集容器、任务和实例级别的 GPU 指标。GPU 指标不是通过基本 Container Insights 收集的；请启用增强型可观测性以访问 GPU 遥测数据。

无需额外安装代理。当集群上启用具有增强型可观测性的 Container Insights 时，系统会自动收集支持的实例类型的 GPU 指标。

有关 GPU 指标和维度的列表，请参阅[具有增强型可观测性的 Amazon ECS Container Insights 指标](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Container-Insights-enhanced-observability-metrics-ECS.html)。

## 实例监控
<a name="instance-monitoring"></a>

要监控支持 Amazon ECS 托管实例工作负载的底层基础设施，您可以使用通过 CloudWatch 提供的 Amazon EC2 指标。

Amazon ECS 托管实例附带两个 Amazon EBS 卷：
+ 用于操作系统文件系统的根卷
+ 应用程序使用的数据卷

启用 Container Insights 后，Amazon ECS 会自动发布实例级别的操作系统和数据文件系统利用率指标。

Amazon ECS 托管实例可用的指标包括：
+ Amazon EC2 指标：CPU 利用率、网络性能、磁盘操作和状态检查。有关更多信息，请参阅[使用 CloudWatch 监控实例](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/viewing_metrics_with_cloudwatch.html)
+ Amazon ECS 指标（启用 Container Insights 时）：操作系统和数据卷文件系统利用率。有关更多信息，请参阅 [Amazon ECS Container Insights 指标](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Container-Insights-metrics-ECS.html)
+ Amazon EBS 指标：IOPS、吞吐量、读取和写入延迟。有关更多信息，请参阅 [Amazon EBS CloudWatch 指标](https://docs.aws.amazon.com/ebs/latest/userguide/using_cloudwatch_ebs.html)

**注意**  
CloudWatch 代理无法作为进程守护程序运行，因为 Amazon ECS 托管实例不支持进程守护程序。这意味着需要将 CloudWatch 代理作为进程守护程序运行的其他系统级指标不可用。

这些指标无需手动安装代理即可自动获得。

### Amazon ECS 托管实例的详细监控
<a name="detailed-monitoring-managed-instances"></a>

CloudWatch 提供两类监控：*基本监控*和*详细监控*。默认情况下，您的托管实例已配置为基本监控。您可以选择启用详细监控，以帮助您更快地识别运行问题并对其采取措施。您可以在创建或更新 Amazon ECS 托管实例容量提供程序时开启或关闭详细监控。

在托管实例上启用详细监控不会影响其附加的 Amazon EBS 卷的监控。

下表突出显示了托管实例的基本监控和详细监控之间的区别。


| 监控类型 | 描述 | 收费 | 
| --- | --- | --- | 
| 基本监控 | 状态检查指标在 1 分钟内可用。所有其他指标均在 5 分钟内可用。 | 免费。 | 
| 详细监控 | 所有指标（包括状态检查指标）在 1 分钟内可用。要获得此级别的数据，您必须为托管实例专门启用此监控。对于已启用详细监控的托管实例，您还可以获取类似托管实例组的聚合数据。 | 您需要为 Amazon ECS 托管实例发送到 CloudWatch 的每个指标付费。您无需为数据存储付费。有关更多信息，请参阅 [CloudWatch 定价页面](https://aws.amazon.com/cloudwatch/pricing/)上的付费套餐和示例 1 – EC2 详细监控。 | 

#### 所需的权限
<a name="iam-detailed-monitoring-managed-instances-permissions"></a>

要启用对托管实例的详细监控，用户必须具有使用 `MonitorInstances` API 操作的权限。要关闭对托管实例的详细监控，用户必须具有使用 `UnmonitorInstances` API 操作的权限。