

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 监控磁带网关
<a name="GatewayMetrics-vtl-common"></a>

本节中的主题描述了有关如何监控磁带网关的过程和概念性信息。可以监控与磁带网关关联的虚拟磁带、缓存存储和上传缓冲区。您可以使用 AWS 管理控制台 来查看您的磁带网关的指标。借助指标，您可以跟踪磁带网关的运行状况并设置警报，以便在一个或多个指标超出定义的阈值时通知您。

您可以使用 Amaz CloudWatch on Logs 来获取有关磁带网关和相关资源运行状况的信息。您可以使用日志来监控网关遇到的错误。此外，您还可以使用 Amazon CloudWatch 订阅筛选器实时自动处理日志信息。

Storage Gateway 免费提供 CloudWatch 指标。记录为期两周的 Storage Gateway 指标。通过使用这些指标，您可以访问历史信息并更好地了解您的磁带网关和虚拟磁带的性能。有关详细信息 CloudWatch，请参阅 [https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)。

可以通过数据吞吐量、数据延迟和每秒操作数这三个衡量指标，来了解存储应用程序在使用磁带网关时的性能。当您使用正确的聚合统计数据时，可使用提供给您的 Storage Gateway 指标来衡量这些值。

**Topics**
+ [使用 CloudWatch 日志组获取磁带网关运行状况日志](cw-log-groups-tape.md)
+ [使用亚马逊 CloudWatch 指标](UsingCloudWatchConsole-vtl-common.md)
+ [了解虚拟磁带指标](monitoring-tape.md)
+ [测量您的磁带网关和之间的性能 AWS](PerfGatewayAWS-vtl-common.md)

# 使用 CloudWatch 日志组获取磁带网关运行状况日志
<a name="cw-log-groups-tape"></a>

您可以使用 Amaz CloudWatch on Logs 来获取有关磁带网关和相关资源运行状况的信息。您可以使用日志来监控网关遇到的错误。此外，您还可以使用 Amazon CloudWatch 订阅筛选器实时自动处理日志信息。有关更多信息，请参阅 *Amazon CloudWatch 用户指南中的[通过订阅实时处理日志数据](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Subscriptions.html)。*

例如，假设您的网关部署在使用 VMware HA 激活的集群中，并且您需要了解任何错误。您可以配置 CloudWatch 日志组来监控您的网关，并在网关遇到错误时收到通知。您可以在激活网关时或在激活网关并运行后配置组。有关如何在激活网关时配置 CloudWatch 日志组的信息，请参阅[配置您的磁带网关](https://docs.aws.amazon.com/storagegateway/latest/tgw/create-gateway-vtl.html#configure-gateway-tape)。有关 CloudWatch 日志组的一般信息，请参阅 *Amazon CloudWatch 用户指南中的[使用日志组和日志流](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html)。*

有关如何排查和修复此类错误的信息，请参阅[对虚拟磁带问题进行故障排除](Main_TapesIssues-vtl.md)。

以下过程说明如何在激活网关后配置 CloudWatch 日志组。

**将 CloudWatch 日志组配置为与您的文件网关配合使用**

1. 登录 AWS 管理控制台 并在[https://console.aws.amazon.com/storagegateway/家](https://console.aws.amazon.com/storagegateway/)中打开 Storage Gateway 控制台。

1. **在导航窗格中，选择 Gateways，然后选择要为其配置 CloudWatch 日志组的网关。**

1. 在 “**操作**” 中，选择 **“编辑网关信息**”，或者在 “**详细信息**” 选项卡上的 “**健康日志**” 和 “**未启用**” 下，选择 “**配置日志组**” 以打开 *CustomerGatewayName*“**编辑**” 对话框。

1. 对于**网关运行状况日志组**，请选择以下选项之一：
   + 如果您不想使用@@ **日志组监控网关，请禁**用 CloudWatch 日志记录。
   + **创建新的日志组**以创建新的 CloudWatch 日志组。
   + **使用现有日志组**使用已存在的 CloudWatch 日志组。

     从**现有日志组列表**中选择一个日志组。

1. 选择**保存更改**。

1. 要查看网关的运行状况日志，请执行以下操作：

   1. **在导航窗格中，选择 Gateways，然后选择您为其配置 CloudWatch 日志组的网关。**

   1. 选择**详细信息**选项卡，然后在 Healt **h Logs** 下选择**CloudWatch 日志**。**日志组详细信息**页面将在 CloudWatch控制台中打开。

以下是发送到的磁带网关事件消息的示例 CloudWatch。此示例显示了一条 `TapeStatusTransition` 消息。

```
    {
    "severity": "INFO",
    "source": "FZTT16FCF5",
    "type": "TapeStatusTransition",
    "gateway": "sgw-C51DFEAC",
    "timestamp": "1581553463831",
    "newStatus": "RETRIEVED"
    }
```

# 使用亚马逊 CloudWatch 指标
<a name="UsingCloudWatchConsole-vtl-common"></a>

您可以使用 AWS 管理控制台 或 CloudWatch API 获取磁带网关的监控数据。控制台将根据来自 CloudWatch API 的原始数据显示一系列图表。该 CloudWatch API 也可以通过[亚马逊 AWS 软件开发套件 (SDKs)](https://aws.amazon.com/tools) 或[亚马逊 CloudWatch API](https://aws.amazon.com/cloudwatch) 工具使用。根据您的需求差异，您可能倾向于使用控制台中显示的图表，也可能倾向于检索自 API 的图表。

无论选择何种方法使用指标，您都必须指定下列信息：
+ 要使用的指标维度。*维度* 是帮助您对某指标进行唯一标识的名称/值对。Storage Gateway 的维度为 `GatewayId` 和 `GatewayName`。在 CloudWatch 控制台中，您可以使用 `Gateway Metrics` 视图来轻松选择特定于网关和特定于磁带的维度。有关尺寸的更多信息，请参阅 *Amazon CloudWatch 用户指南*中的[尺寸](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_concepts.html#Dimension)。
+ 指标名称，如 `ReadBytes`。

下表总结了可供您使用的 Storage Gateway 指标数据的类型。


| Amazon CloudWatch 命名空间 | 维度 | 说明 | 
| --- | --- | --- | 
| AWS/StorageGateway |  GatewayId, GatewayName  |  这些维度筛选描述磁带网关各个方面的指标数据。您可以通过指定 `GatewayId` 和 `GatewayName` 维度来标识要使用的磁带网关。 磁带网关的吞吐量和延迟数据基于磁带网关中的所有虚拟磁带。 数据在 5 分钟期间内自动可用，无需收费。  | 

网关和磁带指标的使用方式类似于其他服务指标。您可以在下面所列的 CloudWatch 文档中找到一个有关某些最常见的指标任务的讨论：
+ [查看可用指标](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/viewing_metrics_with_cloudwatch.html)
+ [获取指标的数据](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/US_GetStatistics.html)
+ [创建 CloudWatch 警报](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)

# 了解虚拟磁带指标
<a name="monitoring-tape"></a>

您可以在下面找到有关包含虚拟磁带的 Storage Gateway 指标的信息。每个磁带均有与其关联的一组指标。

某些特定于磁带的指标可能与某些特定于网关的指标同名。这些指标代表同类度量，但其范围限于磁带，而非网关。在开始工作之前，请指定要使用网关指标还是磁带指标。在使用磁带指标时，请为要查看其指标的磁带指定磁带 ID。有关更多信息，请参阅 [使用亚马逊 CloudWatch 指标](UsingCloudWatchConsole-vtl-common.md)。

**注意**  
某些指标仅在最近的监控期内生成了新数据时才会返回数据点。

下表描述了可用来获取磁带相关信息的 Storage Gateway 指标。


| 指标 | 描述 | 
| --- | --- | 
| CachePercentDirty |  磁带在未传送到 AWS的网关缓存的总体比例中的占比。样本在报告周期结束时采用。 使用网关的 `CachePercentDirty` 指标来查看未传送到 AWS的网关缓存总体比例。有关更多信息，请参阅 [了解网关指标](MonitoringGateways-common.md)。 单位：百分比  | 
| CloudTraffic |  上传的字节数以及从云下载到磁带的字节数。 单位：字节  | 
| IoWaitPercent |  磁带当前使用的已分配 IoWait 单元的百分比。 单位：百分比  | 
| HealthNotification |  由磁带发送的运行状况通知的数量。 单位：计数  | 
| MemUsedBytes |  磁带当前所使用的已分配内存的百分比。 单位：字节  | 
| MemTotalBytes |  磁带当前所用的总内存的百分比。 单位：字节  | 
| ReadBytes   |  文件共享的报告周期内从本地应用程序读取的总字节数。 将此指标与 `Sum` 统计数据结合使用可测量吞吐量，将其与 `Samples` 统计数据结合使用可测量 IOPS。 单位：字节  | 
| UserCpuPercent |  磁带当前所使用的为用户分配的 CPU 计算单位的百分比。 单位：百分比  | 
| WriteBytes |  报告周期内写入到场内应用程序的总字节数。 将此指标与 `Sum` 统计数据结合使用可测量吞吐量，将其与 `Samples` 统计数据结合使用可测量 IOPS。 单位：字节  | 

# 测量您的磁带网关和之间的性能 AWS
<a name="PerfGatewayAWS-vtl-common"></a>

您可以通过数据吞吐量、数据延迟和每秒操作数这三个衡量指标来了解使用磁带网关的应用程序存储的性能状况。当您使用正确的聚合统计数据时，可使用提供给您的 Storage Gateway 指标来衡量这些值。

*统计数据* 是某指标在指定时间内的集合。在中查看指标值时 CloudWatch，使用`Average`统计数据表示数据延迟（毫秒），使用`Samples`统计数据表示每秒 input/output 操作数 (IOPS)。有关更多信息，请参阅 *Amazon CloudWatch 用户指南*中的[统计数据](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_concepts.html#Statistic)。

下表总结了用来测量磁带网关与 AWS之间的吞吐量、延迟和 IOPS 的指标以及相应的统计数据。


| 关注项 | 如何测量 | 
| --- | --- | 
| 延迟 | 将 ReadTime 和 WriteTime 指标结合 Average CloudWatch 统计数据使用。例如，Average 指标的 ReadTime 值为您提供采样周期内的每个操作的延迟时间。 | 
| 吞吐量到 AWS | 在Sum CloudWatch 统计数据中使用CloudBytesDownloaded和CloudBytesUploaded指标。例如，5 分钟采样周期内的CloudBytesDownloaded指标Sum值除以 300 秒，得出从磁带网关到磁带网关的吞吐量， AWS 以每秒字节为单位。 | 
| 数据延迟到 AWS | 将 CloudDownloadLatency 指标与 Average 统计数据结合使用。例如，Average 指标的 CloudDownloadLatency 统计数据为您提供每操作延迟。 | 

**测量从磁带网关到的上传数据吞吐量 AWS**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择**指标**选项卡。

1. 选择 **StorageGateway：网关指标**维度，然后找到要使用的磁带网关。

1. 选择 `CloudBytesUploaded` 指标。

1. 对于 **Time Range**，请选择一个值。

1. 选择 `Sum` 统计数据。

1. 对于 **Period**，请选择值 5 分钟或更长的时间。

1. 在得出的按时间排序的数据点集中，将各个数据点除以周期 (以秒为单位) 获得该样本周期当时的吞吐量。例如，如果给定数据点从磁带网关到的吞吐量 AWS 为 555,544,576 字节，周期为 300 秒，则近似吞吐量为每秒 1.85 兆字节。

**测量从磁带网关到的数据延迟 AWS**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择**指标**选项卡。

1. 选择**StorageGateway: GatewayMetrics**维度，然后找到要使用的磁带网关。

1. 选择 `CloudDownloadLatency` 指标。

1. 对于 **Time Range**，请选择一个值。

1. 选择 `Average` 统计数据。

1. 对于 **Period**，请选择值 5 分钟以匹配默认报告时间。

 得出的按时间排序的数据点集包含以秒为单位的延迟。<a name="GatewayAlarm2-vtl-common"></a>

**将磁带网关吞吐量的上限阈值警报设置为 AWS**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **Create Alarm (创建警报)** 可启动“Create Alarm (创建警报)”向导。

1. 选择 **StorageGateway：网关指标**维度，然后找到要使用的磁带网关。

1. 选择 `CloudBytesUploaded` 指标。

1. 通过定义 `CloudBytesUploaded` 指标在指定时间段大于或等于指定值时的警报状态，定义警报。例如，可定义 `CloudBytesUploaded` 指标在 60 分钟内大于 10MB 时的警报状态。

1. 针对该警报状态配置要采取的行动。例如，可获得向您发送的电子邮件通知。

1. 选择**创建警报**。<a name="GatewayAlarm3-vtl-common"></a>

**为读取数据设置上限阈值警报 AWS**

1. 打开 CloudWatch 控制台，网址为[https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)。

1. 选择 **Create Alarm (创建警报)** 可启动“Create Alarm (创建警报)”向导。

1. 选择 **StorageGateway：网关指标**维度，然后找到要使用的磁带网关。

1. 选择 `CloudDownloadLatency` 指标。

1. 通过定义 `CloudDownloadLatency` 指标在指定时间段大于或等于指定值时的警报状态，定义警报。例如，您可以定义 `CloudDownloadLatency` 在 2 小时内大于 60000 毫秒时的警报状态。

1. 针对该警报状态配置要采取的行动。例如，可获得向您发送的电子邮件通知。

1. 选择**创建警报**。