

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 监控 Storage Gateway
<a name="Main_monitoring-gateways-common"></a>

本节介绍如何使用 Amazon 监控 Storage Gateway，包括监控与网关关联的资源 CloudWatch。您可以监控网关的上传缓冲区和缓存存储。使用 Storage Gateway 控制台来查看网关的指标和警报。例如，您可以查看读写操作中使用的字节数、读写操作耗费的时间以及从 Amazon Web Services 云检索数据耗费的时间。借助指标，您可以跟踪网关的运行状况并设置警报，以便在一个或多个指标超出定义的阈值时通知您。

Storage Gateway 免费提供 CloudWatch 指标。记录为期两周的 Storage Gateway 指标。通过使用这些指标，您可以访问历史信息并更好地了解您的网关和卷的表现。Storage Gateway 还提供 CloudWatch 警报，但高分辨率警报除外，无需额外付费。有关 CloudWatch 定价的更多信息，请参阅 [Amazon CloudWatch 定价](https://aws.amazon.com/cloudwatch/pricing/)。有关更多信息 CloudWatch，请参阅 [Amazon CloudWatch 用户指南](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)。

有关特定于监控卷网关及其关联资源的信息，请参阅 [Monitoring your Volume Gateway](https://docs.aws.amazon.com/storagegateway/latest/vgw/monitoring-volume-gateway.html)。

**Topics**
+ [了解网关指标](MonitoringGateways-common.md)
+ [监控上传缓冲区](PerfUploadBuffer-common.md)
+ [监控缓存存储](PerfCache-common.md)
+ [了解 CloudWatch 警报](cloudwatch-alarms.md)
+ [为您的网关创建推荐的 CloudWatch 警报](cloudwatch-alarms-create-recommended.md)
+ [为您的网关创建自定义 CloudWatch 警报](cloudwatch-alarms-create-alarm.md)
+ [监控卷网关](monitoring-volume-gateway.md)

# 了解网关指标
<a name="MonitoringGateways-common"></a>

在本主题的讨论中，我们将*网关*指标定义为限定在网关范围内的指标，也就是说，这些指标衡量网关的某方面性能。由于一个网关包含一个或多个卷，因此网关特定的指标代表网关上的所有卷。例如，`CloudBytesUploaded` 指标是网关在报告期间发送给云的字节的总数。该指标包括网关上所有卷的活动。

使用网关指标数据时，应指定您希望查看其指标的网关的唯一标识。为此，您可指定 `GatewayId` 和 `GatewayName` 值。希望使用网关的指标时，您在指标命名空间中指定网关*维度*，该维度将网关专属的指标从卷专属的指标区分开。有关更多信息，请参阅 [使用 Amazon CloudWatch 指标](UsingCloudWatchConsole-common.md)。

**注意**  
某些指标仅在最近的监控期内生成了新数据时才会返回数据点。


| 指标 | 说明 | 
| --- | --- | 
| AvailabilityNotifications | 网关生成的与可用性相关的运行状况通知数。 将此指标与 `Sum` 统计数据结合使用可观察网关是否遇到了任何与可用性相关的事件。有关事件的详细信息，请查看您配置的 CloudWatch 日志组。 单位：数字 | 
| CacheHitPercent |  缓存传送的应用程序读取率。样本在报告周期结束时采用。 单位：百分比  | 
| CachePercentDirty |  网关缓存中尚未持久化的总体百分比。 AWS样本在报告周期结束时采用。 将此指标与 `Sum` 统计数据结合使用。 理想情况下，此指标应保持在较低水平。 单位：百分比  | 
| CacheUsed |  网关的缓存存储中正在使用的字节总数。样本在报告周期结束时采用。 单位：字节  | 
| IoWaitPercent |  网关等待本地磁盘响应的时间百分比。 单位：百分比  | 
| MemTotalBytes |  为网关 VM 预配置的 RAM 量，以字节为单位。 单位：字节  | 
| MemUsedBytes |  网关 VM 当前正在使用的 RAM 量，以字节为单位。 单位：字节  | 
| QueuedWrites |  通常，此值表示等待写入的本地存储字节数 AWS，但它也反映了 “引导” 期间本地数据和云数据之间发生的同步过程，每次网关重启时都会发生。 单位：字节  | 
| ReadBytes |  报告周期内网关中的所有卷从场内应用程序读取的总字节数。 将此指标与 `Sum` 统计数据结合使用可测量吞吐量，将其与 `Samples` 统计数据结合使用可测量 IOPS。 单位：字节  | 
| ReadTime |  报告周期内网关中所有卷从本地应用程序进行读取操作所耗费的总毫秒数。 将该指标与 `Average` 统计数据结合使用可测量延迟。 单位：毫秒  | 
| TimeSinceLastRecoveryPoint |  自上次可用还原点以来的时间。有关更多信息，请参阅 [您的缓存网关无法访问，您希望恢复数据](troubleshoot-volume-issues.md#RecoverySnapshotTroubleshooting)。 单位：秒  | 
| TotalCacheSize |  以字节为单位的缓存总大小。样本在报告周期结束时采用。 单位：字节  | 
| UploadBufferPercentUsed |  网关上传缓冲区的使用率。样本在报告周期结束时采用。 单位：百分比  | 
| UploadBufferUsed |  网关的上传缓冲区正在使用的总字节数。样本在报告周期结束时采用。 单位：字节  | 
| UserCpuPercent |  网关处理所花 CPU 时间的百分比，在所有核心上平均计算。 单位：百分比  | 
| WorkingStorageFree |  网关的工作存储空间中未使用的总空间量。样本在报告周期结束时采用。 单位：字节  | 
| WorkingStoragePercentUsed |  网关上传缓冲区的使用率。样本在报告周期结束时采用。 单位：百分比  | 
| WorkingStorageUsed |  网关的上传缓冲区正在使用的总字节数。样本在报告周期结束时采用。 单位：字节  | 
| WriteBytes |  报告周期内网关中所有卷写入场内应用程序的总字节数。 将此指标与 `Sum` 统计数据结合使用可测量吞吐量，将其与 `Samples` 统计数据结合使用可测量 IOPS。 单位：字节  | 
| WriteTime |  报告周期内网关中所有卷从本地应用程序进行写入操作所耗费的总毫秒数。 将该指标与 `Average` 统计数据结合使用可测量延迟。 单位：毫秒  | 

## Storage Gateway 指标的维度
<a name="storagegateway-metric-dimensions"></a>

Storage Gateway 服务的 CloudWatch 命名空间是`AWS/StorageGateway`。数据在 5 分钟期间内自动可用，无需收费。


| 维度 | 说明 | 
| --- | --- | 
|  GatewayId, GatewayName |  这些维度会将您请求的数据筛选为特定于网关的指标。您可以通过 `GatewayId` 或 `GatewayName` 的值标识要工作的网关。如果在您需要查看指标的这段时间范围内，网关的名称发生了变化，则请使用 `GatewayId`。 网关的吞吐量和延迟数据基于网关的所有卷。有关使用网关指标的信息，请参阅[衡量网关与 AWS之间的性能](https://docs.aws.amazon.com/storagegateway/latest/vgw/monitoring-volume-gateway.html#PerfGatewayAWS-common)。  | 
|  VolumeId  |  该维度会将您请求的数据限定为特定于卷的指标。通过要使用的存储卷的 `VolumeId` 值标识该存储卷。有关使用卷指标的信息，请参阅[测量应用程序与网关之间的性能](https://docs.aws.amazon.com/storagegateway/latest/vgw/monitoring-volume-gateway.html#PerfAppGateway-common)。  | 

# 监控上传缓冲区
<a name="PerfUploadBuffer-common"></a>

您可以在下面找到有关如何监控网关的上传缓冲区以及如何创建警报以便您在缓冲区超出指定阈值时收到通知的信息。通过使用此方法，您可以在缓冲区存储空间充满并且存储应用程序停止备份到 AWS前，向网关添加缓冲区存储。

在缓存卷和磁带网关架构中以相同的方式监控上传缓冲区。有关更多信息，请参阅 [卷网关的工作原理](StorageGatewayConcepts.md)。

**注意**  
在 Storage Gateway 中的缓存卷功能发布前，`WorkingStoragePercentUsed`、`WorkingStorageUsed` 和 `WorkingStorageFree` 指标仅适用于存储卷的上传缓冲区。现在，请使用等效上传缓冲区指标 `UploadBufferPercentUsed`、`UploadBufferUsed` 和 `UploadBufferFree`。这些指标适用于两种网关架构。


| 关注项 | 如何测量 | 
| --- | --- | 
| 上传缓冲区使用率 |  将 `UploadBufferPercentUsed`、`UploadBufferUsed` 和 `UploadBufferFree` 指标与 `Average` 统计数据结合使用。例如，将 `UploadBufferUsed` 与 `Average` 结合使用，以分析一段时间内的存储使用率。  | <a name="PerfUploadBufferMeasuring-common"></a>

**测量使用的上传缓冲区的百分比**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **StorageGateway：网关指标**维度，然后找到要使用的网关。

1. 选择 `UploadBufferPercentUsed` 指标。

1. 对于 **Time Range**，请选择一个值。

1. 选择 `Average` 统计数据。

1. 对于 **Period**，请选择值 5 分钟以匹配默认报告时间。

得出的按时间排序的数据点集包含上传缓冲区的使用率。

按照以下步骤，您可以使用 CloudWatch 控制台创建警报。要了解有关警报和阈值的更多信息，请参阅 *Amazon CloudWatch 用户指南*中的[创建 CloudWatch 警报](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)。<a name="GatewayAlarm1-common"></a>

**如需为网关的上传缓冲区设置上阈值警报**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **Create Alarm (创建警报)** 可启动“Create Alarm (创建警报)”向导。

1. 为您的警报指定指标：

   1. 在 “创建警报” 向导的 **“选择指标**” 页面上 **GatewayId，选择AWS/StorageGateway:**，GatewayName维度，然后找到要使用的网关。

   1. 选择 `UploadBufferPercentUsed` 指标。使用 `Average` 统计数据和 5 分钟的周期。

   1. 选择**继续**。

1. 定义警报名称、描述和阈值：

   1. 在“Create Alarm (创建警报)”向导的 **Define Alarm (定义警报)** 页面上，通过分别在 **Name (名称)** 和 **Description (描述)** 框中为您的警报提供名称和说明来标识警报。

   1. 定义警报阈值。

   1. 选择**继续**。

1. 针对该警报配置电子邮件操作：

   1. 在“创建警报”向导的**配置操作**页面上，为**警报状态**选择**警报**。

   1. 为**主题**选择**选择或创建电子邮件**。

      创建电子邮件主题意味着设置 Amazon SNS 主题。*有关亚马逊 SNS 的更多信息，请参阅亚马逊用户指南中的[设置亚马逊 SNS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/US_SetupSNS.html)。 CloudWatch *

   1. 对于 **Topic (主题)**，请为主题输入一个描述性名称。

   1. 选择 **Add Action**。

      

   1. 选择**继续**。

1. 检查警报设置，然后创建警报：

   1. 在“Create Alarm (创建警报)”向导的 **Review (查看)** 页面上，查看警报定义、指标和要执行的相关操作（例如，发送电子邮件通知）。

   1. 检查警报摘要后，选择 **Save Alarm**。

1. 确认您对警报主题的订阅：

   1. 打开已发送到您在创建主题时指定的电子邮件地址的 Amazon SNS 电子邮件。

   1. 单击电子邮件中的链接，确认您的订阅。

      将显示订阅确认。

# 监控缓存存储
<a name="PerfCache-common"></a>

您可以在下面找到有关如何监控网关的缓存存储以及如何创建警报以便您在缓存参数超过指定阈值时收到通知的信息。通过使用此警报，您可以了解何时向网关添加缓存存储。

您只能监控缓存卷架构中的缓存存储。有关更多信息，请参阅 [卷网关的工作原理](StorageGatewayConcepts.md)。


| 关注项 | 如何测量 | 
| --- | --- | 
| 缓存总使用率 |  将 `CachePercentUsed` 和 `TotalCacheSize` 指标结合 `Average` 统计数据使用。例如，将 `CachePercentUsed` 与 `Average` 统计数据结合使用，以分析一段时间内的缓存使用率。 `TotalCacheSize` 指标仅在您向网关添加缓存时变化。  | 
| 从缓存中提供的读取请求的百分比 |  将 `CacheHitPercent` 指标与 `Average` 统计数据结合使用。 通常，您希望 `CacheHitPercent` 保持较高。  | 
| 缓存中肮脏的百分比，也就是说，它包含尚未上传到的内容 AWS |  将 `CachePercentDirty` 指标与 `Average` 统计数据结合使用。 一般而言，您希望 `CachePercentDirty` 保持较低。  | <a name="PerfCacheDirtyMeasuring-common1"></a>

**测量网关及其所有卷的缓存废数据百分比**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **StorageGateway：网关指标**维度，然后找到要使用的网关。

1. 选择 `CachePercentDirty` 指标。

1. 对于 **Time Range**，请选择一个值。

1. 选择 `Average` 统计数据。

1. 对于 **Period**，请选择值 5 分钟以匹配默认报告时间。

得出的按时间排序的数据点集包含 5 分钟以上的时间内的缓存废数据率。<a name="PerfCacheDirtyMeasuring-common"></a>

**测量卷的缓存废数据百分比**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **StorageGateway：交易量指标**维度，然后找到您要使用的交易量。

1. 选择 `CachePercentDirty` 指标。

1. 对于 **Time Range**，请选择一个值。

1. 选择 `Average` 统计数据。

1. 对于 **Period**，请选择值 5 分钟以匹配默认报告时间。

得出的按时间排序的数据点集包含 5 分钟以上的时间内的缓存废数据率。

# 了解 CloudWatch 警报
<a name="cloudwatch-alarms"></a>

CloudWatch 警报根据指标和表达式监控有关您的网关的信息。您可以为网关添加 CloudWatch 警报并在 Storage Gateway 控制台中查看其状态。有关用于监控卷网关的指标的更多信息，请参阅[了解网关指标](https://docs.aws.amazon.com/storagegateway/latest/vgw/Main_monitoring-gateways-common.html#MonitoringGateways-common)和[了解卷指标](https://docs.aws.amazon.com/storagegateway/latest/vgw/monitoring-volume-gateway.html#MonitoringVolumes-common)。对于每个警报，您可以指定启动其“警报”状态的条件。当处于“警报”状态时，Storage Gateway 控制台中的警报状态指示符会变成红色，便于您主动监控状态。您可以将警报配置为根据状态的持续变化自动调用操作。有关 CloudWatch 警报的更多信息，请参阅[亚马逊* CloudWatch 用户指南中的使用亚马逊 CloudWatch*警报](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)。

**注意**  
如果您没有查看权限 CloudWatch，则无法查看警报。

对于每个激活的网关，我们建议您创建以下 CloudWatch 警报：
+ 高 IO 等待：在 15 分钟内对于 3 个数据点，`IoWaitpercent` >= 20
+ 缓存脏百分比：在 20 分钟内对于 4 个数据点，`CachePercentDirty` > 80
+ 运行状况通知：在 5 分钟内对于 1 个数据点，`HealthNotifications` >= 1。配置此警报时，请将**缺少数据处理**设置为 **notBreaching**。
**注意**  
仅当网关在 CloudWatch 中有先前的运行状况通知时，才能设置运行状况通知警报。

对于已激活 HA 模式 VMware 的主机平台上的网关，我们还建议使用此额外 CloudWatch 警报：
+ 可用性通知：在 5 分钟内对于 1 个数据点，`AvailabilityNotifications` >= 1。配置此警报时，请将**缺少数据处理**设置为 **notBreaching**。

下表描述了警报的状态。


| 状态 | 描述 | 
| --- | --- | 
|  **确定**  |  指标或表达式在定义的阈值范围内。  | 
|  **警报**  |  指标或表达式超出定义的阈值。  | 
|  **数据不足**  |  警报刚启动，指标不可用，或指标数据不足以判断警报状态。  | 
|  **无**  |  不会为网关创建警报。要创建新警报，请参阅 [为您的网关创建自定义 CloudWatch 警报](cloudwatch-alarms-create-alarm.md)。  | 
|  **Unavailable**  |  警报状态是未知的。选择 **Unavailable (不可用)** 以查看 **Monitoring (监控)** 选项卡中的错误信息。  | 

# 为您的网关创建推荐的 CloudWatch 警报
<a name="cloudwatch-alarms-create-recommended"></a>

使用 Storage Gateway 控制台创建新网关时，可以选择在初始设置过程中自动创建所有推荐的 CloudWatch 警报。有关更多信息，请参阅[配置卷网关](https://docs.aws.amazon.com/storagegateway/latest/vgw/create-volume-gateway.html#configure-gateway-volume)。如果要为现有网关添加或更新推荐的 CloudWatch 警报，请按以下步骤操作。

**为现有网关添加或更新推荐的 CloudWatch 警报**
**注意**  
此功能需要 CloudWatch 策略权限，而这些权限*不会*作为预配置的 Storage Gateway 完全访问策略的一部分自动授予。在尝试创建推荐 CloudWatch 警报之前，请确保您的安全策略授予以下权限：  
`cloudwatch:PutMetricAlarm` - 创建警报
`cloudwatch:DisableAlarmActions` - 关闭警报操作
`cloudwatch:EnableAlarmActions` - 打开警报操作
`cloudwatch:DeleteAlarms` - 删除警报

1. 在家中打开 Storage Gateway 控制台 [https://console.aws.amazon.com/storagegateway//](https://console.aws.amazon.com/storagegateway/home/)。

1. **在导航窗格中，选择 Gateways，然后选择要为其创建推荐 CloudWatch 警报的网关。**

1. 在网关详细信息页面上，选择**监控**选项卡。

1. 在**警报**下，选择**创建推荐警报**。自动创建推荐的警报。

   **警**报部分列出了特定网关的所有 CloudWatch 警报。在这里，您可以选择和删除一个或多个警报、打开或关闭警报操作以及创建新的警报。

# 为您的网关创建自定义 CloudWatch 警报
<a name="cloudwatch-alarms-create-alarm"></a>

CloudWatch 使用亚马逊简单通知服务 (Amazon SNS) Simple Notification Service 在警报状态发生变化时发送警报通知。警报会监控您指定的一段时间内的一个指标，并根据相对于给定阈值的指标值每隔若干个时间段执行一项或多项操作。操作是向 Amazon SNS 主题发送的通知。您可以在创建警报时创建 Amazon SNS 主题。 CloudWatch 有关 Amazon SNS 的更多信息，请参阅《Amazon Simple Notification Service 开发人员指南》**中的[什么是 Amazon SNS？](https://docs.aws.amazon.com/sns/latest/dg/welcome.html)

**在 Storage Gateway 控制台中创建 CloudWatch 警报**

1. 在家中打开 Storage Gateway 控制台 [https://console.aws.amazon.com/storagegateway//](https://console.aws.amazon.com/storagegateway/home/)。

1. 在导航窗格中，选择**网关**，然后选择要为其创建警报的网关。

1. 在网关详细信息页面上，选择**监控**选项卡。

1. 在 “**警报**” 下，选择 “**创建警报**” 以打开 CloudWatch 控制台。

1. 使用 CloudWatch 控制台创建您想要的警报类型。您可以创建下列类型的警报：
   + 静态阈值警报：基于所选指标的设定阈值的警报。在指标超过阈值的时间达到指定数量的评估期时，警报将变为“警报”状态。

     要创建静态阈值警报，请参阅 *Amazon CloudWatch 用户指南*中的[基于静态阈值创建 CloudWatch 警](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ConsoleAlarms.html)报。
   + 异常检测警报：异常检测挖掘过去的指标数据并创建预期值模型。您可以为异常检测阈值设置一个值，然后在模型中 CloudWatch 使用该阈值来确定该指标的 “正常” 值范围。阈值越高，所产生的“正常”值的范围越大。您可以选择仅当指标值高于预期值范围、低于预期值范围，或出现二者情况之一时激活警报。

     要创建异常检测警报，请参阅 A *mazon CloudWatch 用户*指南中的[基于异常检测创建 CloudWatch 警](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html)报。
   + 指标数学表达式警报：基于数学表达式中使用的一个或多个指标的警报。您指定表达式、阈值和评估期。

     要创建指标数学表达式警报，请参阅 *Amazon CloudWatch 用户指南*中的[基于指标数学表达式创建 CloudWatch 警](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create-alarm-on-metric-math-expression.html)报。
   + 复合警报：通过监控其他警报的警报状态来确定其警报状态的警报。复合警报可以帮助您降低警报噪音。

     要创建复合警报，请参阅 *Amazon CloudWatch 用户指南*中的[创建复合警报](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html)。

1. 在 CloudWatch 控制台中创建警报后，返回到 Storage Gateway 控制台。您可以通过执行以下操作之一查看警报：
   + 在导航窗格中，选择**网关**，然后选择要查看其警报的网关。在**详细信息**选项卡的**警报**下，选择**CloudWatch 警报**。
   + 在导航窗格中，选择**网关**，选择要查看其警报的网关，然后选择**监控**选项卡。

     **警**报部分列出了特定网关的所有 CloudWatch 警报。在这里，您可以选择和删除一个或多个警报、打开或关闭警报操作以及创建新的警报。
   + 在导航窗格中，选择**网关**，然后选择要查看其警报的网关的警报状态。

有关如何编辑或删除警报的信息，请参阅[编辑或删除 CloudWatch 警报](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Edit-CloudWatch-Alarm.html)。

**注意**  
当您使用 Storage Gateway 控制台删除网关时，与该网关关联的所有 CloudWatch 警报也会自动删除。

# 监控卷网关
<a name="monitoring-volume-gateway"></a>

本节中的主题描述了如何在缓存卷或存储卷设置中监控卷网关，包括监控与网关关联的卷和监控上传缓冲区。您可以使用 AWS 管理控制台 来查看网关的指标。例如，您可以查看读写操作中使用的字节数、读写操作耗费的时间以及从 Amazon Web Services 云检索数据耗费的时间。借助指标，您可以跟踪网关的运行状况并设置警报，以便在一个或多个指标超出定义的阈值时通知您。

Storage Gateway 免费提供 CloudWatch 指标。记录为期两周的 Storage Gateway 指标。通过使用这些指标，您可以访问历史信息并更好地了解您的网关和卷的表现。有关详细信息 CloudWatch，请参阅 [Amazon CloudWatch 用户指南](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/)。

**主题**
+ [使用 Amazon 日志获取卷网关运行状况 CloudWatch 日志](cw-log-groups-volume.md)-了解如何使用 Amaz CloudWatch on Logs 获取有关卷网关和相关资源运行状况的信息。
+ [使用 Amazon CloudWatch 指标](UsingCloudWatchConsole-common.md)-了解如何使用 AWS 管理控制台 或 CloudWatch API 获取网关的监控数据。
+ [衡量您的应用程序和网关间的性能。](PerfAppGateway-common.md)：了解如何衡量数据吞吐量、数据延迟和每秒操作数，来了解应用程序和网关之间的性能。
+ [衡量网关和网关之间的性能 AWS](PerfGatewayAWS-common.md)-学习如何测量数据吞吐量、数据延迟和每秒操作次数，以了解网关和 AWS 云之间的性能。
+ [了解卷指标](MonitoringVolumes-common.md)：了解如何衡量指标，这些指标可提供与网关关联的卷的数据。

# 使用 Amazon 日志获取卷网关运行状况 CloudWatch 日志
<a name="cw-log-groups-volume"></a>

您可以使用 Amaz CloudWatch on Logs 来获取有关卷网关和相关资源运行状况的信息。您可以使用这些日志来监控网关遇到的错误。此外，您还可以使用 Amazon CloudWatch 订阅筛选器实时自动处理日志信息。有关更多信息，请参阅 *Amazon CloudWatch 用户指南中的[通过订阅实时处理日志数据](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Subscriptions.html)。*

例如，假设您的网关部署在使用 VMware 高可用性 (HA) 激活的集群中，并且您需要知道任何错误。您可以配置 CloudWatch 日志组来监控您的网关，并在网关遇到错误时收到通知。您可以在激活网关时或在激活网关并运行后配置组。有关如何在激活网关时配置 CloudWatch 日志组的信息，请参阅[配置卷网关](create-volume-gateway.md#configure-gateway-volume)。有关 CloudWatch 日志组的一般信息，请参阅 *Amazon CloudWatch 用户指南中的[使用日志组和日志流](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html)。*

有关如何排查和修复此类错误的信息，请参阅[排查卷问题](troubleshoot-volume-issues.md)。

以下过程说明如何在激活网关后配置 CloudWatch 日志组。

**配置 CloudWatch 日志组以使用您的网关**

1. 登录 AWS 管理控制台 并在[https://console.aws.amazon.com/storagegateway/家](https://console.aws.amazon.com/storagegateway/)中打开 Storage Gateway 控制台。

1. **在左侧导航窗格中，选择 Gateways，然后选择要为其配置 CloudWatch 日志组的网关。**

1. 在 “**操作**” 中，选择 **“编辑网关信息**”，或者在 “**详细信息**” 选项卡上，在 “He **alth log** s” 和 “**未启用**” 下，选择 “**配置日志组**” 以打开 *CustomerGatewayName* “**编辑**” 对话框。

1. 对于**网关运行状况日志组**，请选择以下选项之一：
   + 如果您不想使用@@ **日志组监控网关，请禁**用 CloudWatch 日志记录。
   + **创建新的日志组**以创建新的 CloudWatch 日志组。
   + **使用现有日志组**使用已存在的 CloudWatch 日志组。从**现有日志组列表**中选择一个日志组。

1. 选择**保存更改**。

1. 要查看网关的运行状况日志，请执行以下操作：

   1. **在左侧导航窗格中，选择 Gateways，然后选择您为其配置 CloudWatch 日志组的网关。**

   1. 选择 “**详细信息**” 选项卡，然后在 “Healt **h Logs**” 下，选择 “**CloudWatch 日志**”。**日志组详情**页面将在 Amazon CloudWatch 控制台中打开。

# 使用 Amazon CloudWatch 指标
<a name="UsingCloudWatchConsole-common"></a>

您可以使用 AWS 管理控制台 或 CloudWatch API 获取网关的监控数据。控制台根据来自 CloudWatch API 的原始数据显示一系列图表。您也可以通过[AWS 软件开发套件 (SDKs)](https://aws.amazon.com/tools) 或[亚马逊 CloudWatch API 工具使用 API](https://aws.amazon.com/cloudwatch)。 CloudWatch 根据您的需求差异，您可能倾向于使用控制台中显示的图表，也可能倾向于检索自 API 的图表。

无论选择何种方法使用指标，您都必须指定下列信息：
+ 要使用的指标维度。*维度* 是帮助您对某指标进行唯一标识的名称/值对。Storage Gateway 的维度为 `GatewayId`、`GatewayName` 和 `VolumeId`。在 CloudWatch 控制台中，您可以使用`Gateway Metrics`和`Volume Metrics`视图轻松选择特定于网关的维度和特定于卷的维度。有关尺寸的更多信息，请参阅 *Amazon CloudWatch 用户指南*中的[尺寸](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_concepts.html#Dimension)。
+ 指标名称，如 `ReadBytes`。

下表总结了您可使用的 Storage Gateway 指标数据的类型。

[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/vgw/UsingCloudWatchConsole-common.html)

网关和卷指标的使用方式类似于其他服务指标。您可以在下面所列的 CloudWatch 文档中找到一个有关某些最常见的指标任务的讨论：
+ [查看可用指标](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/viewing_metrics_with_cloudwatch.html)
+ [获取指标的数据](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/US_GetStatistics.html)
+ [创建 CloudWatch 警报](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)

# 衡量您的应用程序和网关间的性能。
<a name="PerfAppGateway-common"></a>

数据吞吐量、数据延迟和每秒操作数是您可用来了解使用网关的应用程序存储性能状况的三个度量指标。当使用正确的聚合统计数据时，您可使用 Storage Gateway 指标来度量这些值。

*统计数据* 是某指标在指定时间内的集合。在中查看指标值时 CloudWatch，使用`Average`统计数据表示数据延迟（毫秒），使用统计数据表示数据吞吐量（每秒字节数），使用`Samples`统计数据表示每秒 input/output 操作数 (IOPS)。`Sum`有关更多信息，请参阅 *Amazon CloudWatch 用户指南*中的[统计数据](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_concepts.html#Statistic)。

下表总结了可用来衡量应用程序和网关之间的吞吐量、延迟和 IOPS 的指标和相应统计数据。


| 关注项 | 如何测量 | 
| --- | --- | 
| 吞吐量  |  将 `ReadBytes` 和 `WriteBytes` 指标结合 `Sum` CloudWatch 统计数据使用。例如，5 分钟采样周期内的 `Sum` 指标的 `ReadBytes` 值除以 300 秒可以得出每秒字节数速率的吞吐量。  | 
| 延迟 | 将 ReadTime 和 WriteTime 指标结合 Average CloudWatch 统计数据使用。例如，Average 指标的 ReadTime 值为您提供采样周期内的每个操作的延迟时间。 | 
| IOPS | 将 ReadBytes 和 WriteBytes 指标结合 Samples CloudWatch 统计数据使用。例如，5 分钟采样周期内的 Samples 指标的 ReadBytes 值除以 300 秒可以得出 IOPS。 | 

对于平均延迟图表和平均大小图表，平均值通过该期间内完成的操作（读取或写入，以适用于图表者为准）总数计算得出。

**度量应用程序到卷的数据吞吐量**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **Metrics**，再选择 **All metrics** 选项卡，然后选择 **Storage Gateway**。

1. 选择 **Volume metrics** 维度，然后找到要使用的卷。

1. 选择 `ReadBytes` 和 `WriteBytes` 指标。

1. 对于 **Time Range**，请选择一个值。

1. 选择 `Sum` 统计数据。

1. 对于 **Period**，请选择值 5 分钟或更长的时间。

1. 在得出的按时间排序的数据点集中， (其中一个用于 `ReadBytes`，另一个用于 `WriteBytes`)，将各个数据点除以周期 (以秒为单位) 得出采样点当时的吞吐量。总吞吐量是各个点吞吐量的和。

例如，如果在 300 秒期间内读取吞吐量为 2384199680 字节，则该数据点的近似吞吐率为每秒 7.9 兆字节。

**测量从应用程序到卷的每秒数据 input/output 操作次数**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **Metrics**，再选择 **All metrics** 选项卡，然后选择 **Storage Gateway**。

1. 选择 **Volume metrics** 维度，然后找到要使用的卷。

1. 选择 `ReadBytes` 和 `WriteBytes` 指标。

1. 对于 **Time Range**，请选择一个值。

1. 选择 `Samples` 统计数据。

1. 对于 **Period**，请选择值 5 分钟或更长的时间。

1. 在得出的按时间排序的数据点集中 (其中一个用于 `ReadBytes`，另一个用于 `WriteBytes`)，将各个数据点除以周期 (以秒为单位) 得出 IOPS。

例如，如果在 300 秒期间内写入操作的数量为 24373，则该数据点的 IOPS 为每秒 81 次写入操作。

# 衡量网关和网关之间的性能 AWS
<a name="PerfGatewayAWS-common"></a>

数据吞吐量、数据延迟和每秒操作是您可用来理解使用 Storage Gateway 的应用程序存储性能状况的三个衡量指标。这三个值均可使用 Storage Gateway 指标来衡量，这些指标在您使用正确的集合统计数据时为您提供。下表总结了用来衡量网关和 AWS间的吞吐量、延迟和每秒输入/输出操作次数 (IOPS) 的指标和相应统计数据。


| 关注项 | 如何测量 | 
| --- | --- | 
| 吞吐量  |  将 `ReadBytes` 和 `WriteBytes` 指标结合 `Sum` CloudWatch 统计数据使用。例如，5 分钟采样周期内的 `Sum` 指标的 `ReadBytes` 值除以 300 秒可以得出每秒字节数速率的吞吐量。  | 
| 延迟 | 将 ReadTime 和 WriteTime 指标结合 Average CloudWatch 统计数据使用。例如，Average 指标的 ReadTime 值为您提供采样周期内的每个操作的延迟时间。 | 
| IOPS | 将 ReadBytes 和 WriteBytes 指标结合 Samples CloudWatch 统计数据使用。例如，5 分钟采样周期内的 Samples 指标的 ReadBytes 值除以 300 秒可以得出 IOPS。 | 
| 吞吐量到 AWS | 在Sum CloudWatch 统计数据中使用CloudBytesDownloaded和CloudBytesUploaded指标。例如，5 分钟采样周期内的CloudBytesDownloaded指标Sum值除以 300 秒得出从 AWS 网关到网关的吞吐量，单位为每秒字节数。 | 
| 数据延迟到 AWS | 将 CloudDownloadLatency 指标与 Average 统计数据结合使用。例如，Average 指标的 CloudDownloadLatency 统计数据为您提供每操作延迟。 | 

**测量从网关到的上传数据吞吐量 AWS**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **Metrics**，再选择 **All metrics** 选项卡，然后选择 **Storage Gateway**。

1. 选择 **Gateway metrics** 维度并找到您希望使用的卷。

1. 选择 `CloudBytesUploaded` 指标。

1. 对于 **Time Range**，请选择一个值。

1. 选择 `Sum` 统计数据。

1. 对于 **Period**，请选择值 5 分钟或更长的时间。

1. 在得出的按时间排序的数据点集中，将各个数据点除以周期 (以秒为单位) 获得该样本周期当时的吞吐量。

将光标悬停在数据点上就会显示有关该数据点的信息，包括其值和上传的字节数。将该值除以 **Period** 值 (5 分钟) 得出采样点当时的吞吐量。例如，如果在 300 秒内从网关到的吞吐量 AWS 为 555,544,576 字节，则每秒的大致吞吐量为每秒 1.85 兆字节。

 

![\[网关的上传云字节数示例指标图表，其中包含总和统计数据。\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/vgw/images/GatewayMetrics_25.png)


**如需衡量网关的每操作延迟**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **Metrics**，再选择 **All metrics** 选项卡，然后选择 **Storage Gateway**。

1. 选择 **Gateway metrics** 维度并找到您希望使用的卷。

1. 选择 `ReadTime` 和 `WriteTime` 指标。

1. 对于 **Time Range**，请选择一个值。

1. 选择 `Average` 统计数据。

1. 对于 **Period**，请选择值 5 分钟以匹配默认报告时间。

1.  在得出的按时间排序的点集中 (其中一个用于 `ReadTime`，另一个用于 `WriteTime`)，在相同的时间样本添加数据点，以得出以毫秒为单位的总延迟。

**测量从网关到的数据延迟 AWS**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **Metrics**，再选择 **All metrics** 选项卡，然后选择 **Storage Gateway**。

1. 选择 **Gateway metrics** 维度并找到您希望使用的卷。

1. 选择 `CloudDownloadLatency` 指标。

1. 对于 **Time Range**，请选择一个值。

1. 选择 `Average` 统计数据。

1. 对于 **Period**，请选择值 5 分钟以匹配默认报告时间。

得出的按时间排序的数据点集包含以秒为单位的延迟。<a name="GatewayAlarm2-common"></a>

**要将网关吞吐量的上限阈值警报设置为 AWS**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **Alarms**。

1. 选择 **Create Alarm (创建警报)** 可启动“Create Alarm (创建警报)”向导。

1. 选择 **Storage Gateway** 维度并找到要使用的网关。

1. 选择 `CloudBytesUploaded` 指标。

1. 要定义警报，请在 `CloudBytesUploaded` 指标大于或等于指定时间段的指定值时定义警报状态。例如，您可以定义 `CloudBytesUploaded` 指标在 60 分钟内 大于 10 MB 时的状态。

1. 针对该警报状态配置要采取的行动。例如，可获得向您发送的电子邮件通知。

1. 选择**创建警报**。<a name="GatewayAlarm3-common"></a>

**要设置上限阈值警报，以便从中读取数据 AWS**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **Create Alarm (创建警报)** 可启动“Create Alarm (创建警报)”向导。

1. 选择 **StorageGateway：网关指标**维度，然后找到要使用的网关。

1. 选择 `CloudDownloadLatency` 指标。

1. 通过定义 `CloudDownloadLatency` 指标在指定时间段大于或等于指定值时的警报状态，定义警报。例如，您可以定义 `CloudDownloadLatency` 在 2 小时内大于 60000 毫秒时的警报状态。

1. 针对该警报状态配置要采取的行动。例如，可获得向您发送的电子邮件通知。

1. 选择**创建警报**。

# 了解卷指标
<a name="MonitoringVolumes-common"></a>

您可以在下面找到有关包含网关的卷的 Storage Gateway 指标的信息。网关的每个卷均有与其关联的一组指标。

一些卷特定的指标具有和某些网关特定的指标相同的名称。这些指标代表同类度量，但其范围限于卷，而非网关。在开始工作之前，请指定要使用网关指标还是卷指标。具体而言，在使用卷指标时，请为要查看其指标的存储卷指定卷 ID。有关更多信息，请参阅 [使用 Amazon CloudWatch 指标](UsingCloudWatchConsole-common.md)。

**注意**  
某些指标仅在最近的监控期内生成了新数据时才会返回数据点。

下表描述了可用来获取有关存储卷的信息的 Storage Gateway 指标。


| 指标 | 描述 | 缓存卷 | 存储卷 | 
| --- | --- | --- | --- | 
| AvailabilityNotification |  由卷发送的可用性通知的数量。 单位：计数  | 支持 | 是 | 
| CacheHitPercent |  应用程序从卷中读取的百分率，由缓存传送。样本在报告周期结束时采用。 在没有应用程序从卷读取时，该指标报告 100%。 单位：百分比  | 是 | 否 | 
| CachePercentDirty |  卷在未传送到 AWS的网关缓存的总体比例中的占比。样本在报告周期结束时采用。 使用网关的 `CachePercentDirty` 指标来查看未传送到 AWS的网关缓存总体比例。有关更多信息，请参阅 [了解网关指标](MonitoringGateways-common.md)。 单位：百分比  | 支持 | 是 | 
| CachePercentUsed |  卷对网关缓存存储空间的总体使用率占比。样本在报告周期结束时采用。 使用网关的 `CachePercentUsed` 指标来查看网关缓存存储空间的总体使用率。有关更多信息，请参阅 [了解网关指标](MonitoringGateways-common.md)。 单位：百分比  | 是 | 否 | 
| CloudBytesDownloaded |  从云下载到卷的字节数。 单位：字节  | 支持 | 是 | 
| CloudBytesUploaded |  从卷上传到云的字节数。 单位：字节  | 支持 | 是 | 
| HealthNotification |  由卷发送的运行状况通知的数量。 单位：计数  | 支持 | 是 | 
| IoWaitPercent |  该卷当前使用的 IoWaitPercent 单位的百分比。 单位：百分比  | 支持 | 是 | 
| MemTotalBytes |  卷当前所用的总内存的百分比。 单位：百分比  | 是 | 否 | 
| MemoryUsage |  卷当前所用的内存的百分比。 单位：百分比  | 是 | 否 | 
| ReadBytes  |  报告周期内从场内应用程序读取的总字节数。 将此指标与 `Sum` 统计数据结合使用可测量吞吐量，将其与 `Samples` 统计数据结合使用可测量 IOPS。 单位：字节  | 支持 | 是 | 
| ReadTime |  报告周期内从本地应用程序进行读取操作所耗费的总毫秒数。 将该指标与 `Average` 统计数据结合使用可测量延迟。 单位：毫秒  | 支持 | 是 | 
| UserCpuPercent |  卷当前所使用的已分配 CPU 计算单位的百分比。 单位：百分比  | 支持 | 是 | 
| WriteBytes |  报告周期内写入到场内应用程序的总字节数。 将此指标与 `Sum` 统计数据结合使用可测量吞吐量，将其与 `Samples` 统计数据结合使用可测量 IOPS。 单位：字节  | 支持 | 是 | 
| WriteTime |  报告周期内从本地应用程序进行写入操作所耗费的总毫秒数。 将该指标与 `Average` 统计数据结合使用可测量延迟。 单位：毫秒  | 支持 | 是 | 
| QueuedWrites |  等待写入的字节数 AWS，在报告周期结束时采样。 单位：字节  | 支持 | 是 | 