

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 排查网关问题
<a name="troubleshooting-gateway-issues"></a>

接下来，可以查找有关与网关、主机平台、虚拟磁带、高可用性、数据恢复和安全性相关的最佳实践以及问题故障排除的信息。本地网关故障排除信息涵盖部署在支持的虚拟化平台上的网关。高可用性问题的故障排除信息涵盖在 VMware vSphere 高可用性 (HA) 平台上运行的网关。

**主题**
+ [故障排除：网关离线问题](troubleshooting-gateway-offline.md)：了解如何诊断可能导致网关在 Storage Gateway 控制台中显示为离线的问题。
+ [故障排除：网关激活期间的内部错误](troubleshooting-gateway-activation.md)：了解在尝试激活 Storage Gateway 时收到内部错误消息的情况下该怎么做。
+ [排查本地网关问题](troubleshooting-on-premises-gateway-issues.md)-了解在使用本地网关时可能遇到的典型问题，以及如何允许 支持 连接到网关以帮助进行故障排除。
+ [排查 Microsoft Hyper-V 设置](troubleshooting-hyperv-setup.md)：了解您在 Microsoft Hyper-V 平台上部署 Storage Gateway 时可能遇到的典型问题。
+ [排查 Amazon EC2 网关问题](troubleshooting-EC2-gateway-issues.md)-查找有关您在使用部署在 Amazon 上的网关时可能遇到的典型问题的信息 EC2。
+ [排查硬件设备问题](troubleshooting-hardware-appliance-issues.md)：了解如何解决您可能遇到的有关 Storage Gateway 硬件设备的问题。
+ [对虚拟磁带问题进行故障排除](Main_TapesIssues-vtl.md)：了解在虚拟磁带出现意外问题时可以采取的措施。
+ [排查高可用性问题](troubleshooting-ha-issues.md)-了解在 VMware HA 环境中部署的网关遇到问题时该怎么做。

# 故障排除：网关离线问题
<a name="troubleshooting-gateway-offline"></a>

使用以下故障排除信息，来确定当 AWS Storage Gateway 控制台显示网关处于离线状态时该怎么做。

网关可能由于以下一个或多个原因而显示为离线：
+ 网关无法到达 Storage Gateway 服务端点。
+ 网关意外关闭。
+ 与网关关联的缓存磁盘已断开连接或经过修改，或者出现故障。

要使网关恢复在线，请确定并解决导致网关离线的问题。

## 检查关联的防火墙或代理
<a name="w2ab1c40c12c11"></a>

如果您将网关配置为使用代理，或者将网关置于防火墙后面，请查看代理或防火墙的访问规则。代理或防火墙必须可让流量进出 Storage Gateway 所需的网络端口和服务端点。有关更多信息，请参阅 [Network and firewall requirements](https://docs.aws.amazon.com/storagegateway/latest/tgw/Requirements.html#networks)。

## 检查是否正在对网关的流量进行 SSL 检查或深度数据包检查
<a name="w2ab1c40c12c13"></a>

如果当前正在对网关与之间的网络流量执行 SSL 或深度数据包检查 AWS，则您的网关可能无法与所需的服务端点通信。要使网关恢复在线，必须禁用检查。

## 检查虚拟机监控程序主机上是否出现停电或硬件故障
<a name="w2ab1c40c12c17"></a>

网关的虚拟机监控程序主机出现停电或硬件故障，可能会导致网关意外关闭且无法访问。在恢复电源和网络连接后，网关将再次变为可访问。

网关恢复在线后，请务必采取措施来恢复数据。有关更多信息，请参阅 [Best practices for recovering your data](https://docs.aws.amazon.com/storagegateway/latest/tgw/recover-data-from-gateway.html)。

## 检查关联的缓存磁盘是否有问题
<a name="w2ab1c40c12c19"></a>

如果与网关关联的缓存磁盘中至少有一个被移除、更改或调整大小，或者它已损坏，则网关可能会进入离线状态。

**如果从虚拟机监控程序主机上移除了正常工作的缓存磁盘：**

1. 关闭网关。

1. 重新添加该磁盘。
**注意**  
确保将磁盘添加到同一个磁盘节点。

1. 重新启动网关。

**如果缓存磁盘损坏、被更换或调整大小：**

1. 关闭网关。

1. 重置缓存磁盘。

1. 重新配置磁盘以进行缓存存储。

1. 重新启动网关。

有关对磁带网关的已损坏缓存磁盘进行故障排除的更多信息，请参阅 [You need to recover a virtual tape from a malfunctioning cache disk](https://docs.aws.amazon.com/storagegateway/latest/tgw/Main_TapesIssues-vtl.html#creating-recovery-tape-vtl)。

# 故障排除：网关激活期间的内部错误
<a name="troubleshooting-gateway-activation"></a>

Storage Gateway 激活请求会经过两条网络路径。客户端发送的传入激活请求通过端口 80 连接到网关的虚拟机（VM）或 Amazon Elastic Compute Cloud（Amazon EC2）实例。如果网关成功收到激活请求，则网关将与 Storage Gateway 端点通信来接收激活密钥。如果网关无法到达 Storage Gateway 端点，则网关会以一则内部错误消息响应客户端。

使用以下故障排除信息，来确定在尝试激活 AWS Storage Gateway的过程中收到内部错误消息时该怎么做。

**注意**  
确保使用最新的虚拟机映像文件或亚马逊机器映像（AMI）版本部署新的网关。如果您尝试激活使用过时 AMI 的网关，则会收到内部错误消息。
在下载 AMI 之前，请务必选择要部署的正确网关类型。每种网关类型的.ova 文件都不同，并且不可互换。 AMIs 

## 解决使用公有端点激活网关时出现的错误
<a name="w2ab1c40c15b9"></a>

要解决使用公有端点激活网关时的激活错误，请执行以下检查和配置。

### 检查所需的端口
<a name="w2ab1c40c15b9b5"></a>

对于本地部署的网关，请检查本地防火墙上的端口是否为打开状态。对于部署在 Amazon EC2 实例上的网关，请检查实例安全组上的端口是否为打开状态。要确认端口为打开状态，请从服务器上对公有端点运行 telnet 命令。此服务器必须与网关位于同一子网中。例如，以下 telnet 命令测试与端口 443 的连接：

```
telnet d4kdq0yaxexbo.cloudfront.net 443
telnet storagegateway.region.amazonaws.com 443
telnet dp-1.storagegateway.region.amazonaws.com 443
telnet proxy-app.storagegateway.region.amazonaws.com 443
telnet client-cp.storagegateway.region.amazonaws.com 443
telnet anon-cp.storagegateway.region.amazonaws.com 443
```

要确认网关本身是否可以到达端点，请访问网关的本地 VM 控制台（适用于本地部署的网关）。或者，可以通过 SSH 连接到网关的实例（适用于部署在 Amazon EC2 上的网关）。然后，运行网络连接测试。确认测试返回 `[PASSED]`。有关更多信息，请参阅 [Testing Your Gateway Connection to the Internet](https://docs.aws.amazon.com/storagegateway/latest/tgw/manage-on-premises-common.html#MaintenanceTestGatewayConnectivity-common)。

**注意**  
网关控制台的默认登录用户名为 `admin`，默认密码为 `password`。

### 确保防火墙安全性不会修改从网关发送到公有端点的数据包
<a name="w2ab1c40c15b9b7"></a>

SSL 检查、深度数据包检查或其它形式的防火墙安全性可能会干扰从网关发送的数据包。如果 SSL 证书的修改结果与激活端点所预期的情况不同，则 SSL 握手失败。要确认没有正在进行的 SSL 检查，请在端口 443 上的主激活端点 (`anon-cp.storagegateway.region.amazonaws.com`) 上运行 OpenSSL 命令。必须从与网关位于同一子网中的计算机上运行此命令：

```
$ openssl s_client -connect  anon-cp.storagegateway.region.amazonaws.com:443 -servername anon-cp.storagegateway.region.amazonaws.com
```

**注意**  
替换*region*为你的 AWS 区域。

如果没有正在进行的 SSL 检查，则该命令将返回类似于以下内容的响应：

```
$ openssl s_client -connect anon-cp.storagegateway.us-east-2.amazonaws.com:443 -servername anon-cp.storagegateway.us-east-2.amazonaws.com
CONNECTED(00000003)
depth=2 C = US, O = Amazon, CN = Amazon Root CA 1
verify return:1
depth=1 C = US, O = Amazon, OU = Server CA 1B, CN = Amazon
verify return:1
depth=0 CN = anon-cp.storagegateway.us-east-2.amazonaws.com
verify return:1
---
Certificate chain
 0 s:/CN=anon-cp.storagegateway.us-east-2.amazonaws.com
   i:/C=US/O=Amazon/OU=Server CA 1B/CN=Amazon
 1 s:/C=US/O=Amazon/OU=Server CA 1B/CN=Amazon
   i:/C=US/O=Amazon/CN=Amazon Root CA 1
 2 s:/C=US/O=Amazon/CN=Amazon Root CA 1
   i:/C=US/ST=Arizona/L=Scottsdale/O=Starfield Technologies, Inc./CN=Starfield Services Root Certificate Authority - G2
 3 s:/C=US/ST=Arizona/L=Scottsdale/O=Starfield Technologies, Inc./CN=Starfield Services Root Certificate Authority - G2
   i:/C=US/O=Starfield Technologies, Inc./OU=Starfield Class 2 Certification Authority
---
```

如果正在进行 SSL 检查，则响应将显示更改的证书链，类似于以下内容：

```
$ openssl s_client -connect  anon-cp.storagegateway.ap-southeast-1.amazonaws.com:443 -servername anon-cp.storagegateway.ap-southeast-1.amazonaws.com
CONNECTED(00000003)
depth=0 DC = com, DC = amazonaws, OU = AWS, CN = anon-cp.storagegateway.ap-southeast-1.amazonaws.com
verify error:num=20:unable to get local issuer certificate
verify return:1
depth=0 DC = com, DC = amazonaws, OU = AWS, CN = anon-cp.storagegateway.ap-southeast-1.amazonaws.com
verify error:num=21:unable to verify the first certificate
verify return:1
---
Certificate chain
 0 s:/DC=com/DC=amazonaws/OU=AWS/CN=anon-cp.storagegateway.ap-southeast-1.amazonaws.com
   i:/C=IN/O=Company/CN=Admin/ST=KA/L=New town/OU=SGW/emailAddress=admin@company.com
---
```

激活端点仅在识别 SSL 证书时才接受 SSL 握手。这意味着，网关到端点的出站流量必须免受网络中防火墙执行的检查。这些检查可能是 SSL 检查或深度数据包检查。

### 检查网关时间同步
<a name="w2ab1c40c15b9b9"></a>

时间偏差过大可能会导致 SSL 握手错误。对于本地网关，可以使用网关的本地 VM 控制台来检查网关的时间同步。时间偏差应不大于 60 秒。有关更多信息，请参阅 [Synchronizing Your Gateway VM Time](https://docs.aws.amazon.com/storagegateway/latest/tgw/MaintenanceTimeSync-hyperv.html)。

**系统时间管理**选项在托管于 Amazon EC2 实例上的网关中不可用。为确保 Amazon EC2 网关能够正确地同步时间，请确认 Amazon EC2 实例可以通过端口 UDP 和 TCP 123 连接到以下 NTP 服务器池列表：
+ 0.amazon.pool.ntp.org
+ 1.amazon.pool.ntp.org
+ 2.amazon.pool.ntp.org
+ 3.amazon.pool.ntp.org

## 解决使用 Amazon VPC 端点激活网关时出现的错误
<a name="w2ab1c40c15c11"></a>

要解决使用 Amazon Virtual Private Cloud（Amazon VPC）端点激活网关时出现的激活错误，请执行以下检查和配置。

### 检查所需的端口
<a name="w2ab1c40c15c11b5"></a>

确保本地防火墙（对于本地部署的网关）或安全组（对于部署在 Amazon EC2 中的网关）中的所需端口处于打开状态。将网关连接到 Storage Gateway VPC 端点所需的端口与将网关连接到公有端点时所需的端口不同。连接到 Storage Gateway VPC 端点需要以下端口：
+ TCP 443
+ TCP 1026
+ TCP 1027
+ TCP 1028
+ TCP 1031
+ TCP 2222

有关更多信息，请参阅 [Creating a VPC endpoint for Storage Gateway](https://docs.aws.amazon.com/storagegateway/latest/tgw/gateway-private-link.html#create-vpc-endpoint)。

此外，请检查连接到 Storage Gateway VPC 端点的安全组。连接到端点的默认安全组可能不支持所需的端口。创建一个新的安全组，让来自网关 IP 地址范围的流量通过所需端口。然后，将该安全组连接到 VPC 端点。

**注意**  
使用 [Amazon VPC 控制台](https://console.aws.amazon.com//vpc/)来验证连接到 VPC 端点的安全组。从控制台查看 Storage Gateway VPC 端点，然后选择**安全组**选项卡。

要确认所需端口处于打开状态，可以在 Storage Gateway VPC 端点上运行 telnet 命令。必须从与网关位于同一子网中的服务器上运行这些命令。可以对第一个未指定可用区的 DNS 名称运行测试。例如，以下 telnet 命令使用 DNS 名称 vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 测试所需的端口连接：

```
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 443
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 1026
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 1027
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 1028
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 1031
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 2222
```

### 确保防火墙安全性不会修改从网关发送到 Storage Gateway Amazon VPC 端点的数据包
<a name="w2ab1c40c15c11b7"></a>

SSL 检查、深度数据包检查或其它形式的防火墙安全性可能会干扰从网关发送的数据包。如果 SSL 证书的修改结果与激活端点所预期的情况不同，则 SSL 握手失败。要确认没有正在进行的 SSL 检查，请在 Storage Gateway VPC 端点上运行 OpenSSL 命令。必须从与网关位于同一子网中的计算机上运行此命令。针对每个必需的端口运行命令：

```
$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:443 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com

$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1026 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com

$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1027 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com

$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1028 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com

$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1031 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com

$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:2222 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com
```

如果没有正在进行的 SSL 检查，则该命令将返回类似于以下内容的响应：

```
openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1027 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com
CONNECTED(00000005)
depth=2 C = US, O = Amazon, CN = Amazon Root CA 1
verify return:1
depth=1 C = US, O = Amazon, OU = Server CA 1B, CN = Amazon
verify return:1
depth=0 CN = anon-cp.storagegateway.us-east-1.amazonaws.com
verify return:1
---
Certificate chain
 0 s:CN = anon-cp.storagegateway.us-east-1.amazonaws.com
   i:C = US, O = Amazon, OU = Server CA 1B, CN = Amazon
 1 s:C = US, O = Amazon, OU = Server CA 1B, CN = Amazon
   i:C = US, O = Amazon, CN = Amazon Root CA 1
 2 s:C = US, O = Amazon, CN = Amazon Root CA 1
   i:C = US, ST = Arizona, L = Scottsdale, O = "Starfield Technologies, Inc.", CN = Starfield Services Root Certificate Authority - G2
 3 s:C = US, ST = Arizona, L = Scottsdale, O = "Starfield Technologies, Inc.", CN = Starfield Services Root Certificate Authority - G2
   i:C = US, O = "Starfield Technologies, Inc.", OU = Starfield Class 2 Certification Authority
---
```

如果正在进行 SSL 检查，则响应将显示更改的证书链，类似于以下内容：

```
openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1027 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com
CONNECTED(00000005)
depth=2 C = US, O = Amazon, CN = Amazon Root CA 1
verify return:1
depth=1 C = US, O = Amazon, OU = Server CA 1B, CN = Amazon
verify return:1
depth=0 DC = com, DC = amazonaws, OU = AWS, CN = anon-cp.storagegateway.us-east-1.amazonaws.com
verify error:num=21:unable to verify the first certificate
verify return:1
---
Certificate chain
 0 s:/DC=com/DC=amazonaws/OU=AWS/CN=anon-cp.storagegateway.us-east-1.amazonaws.com
   i:/C=IN/O=Company/CN=Admin/ST=KA/L=New town/OU=SGW/emailAddress=admin@company.com
---
```

激活端点仅在识别 SSL 证书时才接受 SSL 握手。这意味着，网关通过所需端口到 VPC 端点的出站流量免受由网络防火墙执行的检查。这些检查可能是 SSL 检查或深度数据包检查。

### 检查网关时间同步
<a name="w2ab1c40c15c11b9"></a>

时间偏差过大可能会导致 SSL 握手错误。对于本地网关，可以使用网关的本地 VM 控制台来检查网关的时间同步。时间偏差应不大于 60 秒。有关更多信息，请参阅 [Synchronizing Your Gateway VM Time](https://docs.aws.amazon.com/storagegateway/latest/tgw/MaintenanceTimeSync-hyperv.html)。

**系统时间管理**选项在托管于 Amazon EC2 实例上的网关中不可用。为确保 Amazon EC2 网关能够正确地同步时间，请确认 Amazon EC2 实例可以通过端口 UDP 和 TCP 123 连接到以下 NTP 服务器池列表：
+ 0.amazon.pool.ntp.org
+ 1.amazon.pool.ntp.org
+ 2.amazon.pool.ntp.org
+ 3.amazon.pool.ntp.org

### 检查 HTTP 代理并确认关联的安全组设置
<a name="w2ab1c40c15c11c11"></a>

在激活之前，请检查您是否在本地网关 VM 上将 Amazon EC2 上的 HTTP 代理配置为端口 3128 上的 Squid 代理。在此情况下，确认以下事项：
+ 连接到 Amazon EC2 上 HTTP 代理的安全组必须具有入站规则。此入站规则必须在端口 3128 上支持来自网关 VM 的 IP 地址的 Squid 代理流量。
+ 连接到 Amazon EC2 VPC 端点的安全组必须具有入站规则。这些入站规则必须在端口 1026-1028、1031、2222 和 443 上支持来自 Amazon EC2 上 HTTP 代理的 IP 地址的流量。

## 解决使用公有端点激活网关且同一 VPC 中有 Storage Gateway VPC 端点时出现的错误
<a name="w2ab1c40c15c13"></a>

要解决在同一 VPC 中有 Amazon Virtual Private Cloud（Amazon VPC）端点的情况下使用公有端点激活网关时出现的错误，请执行以下检查和配置。

### 确认 Storage Gateway VPC 端点上**启用私有 DNS 名称**设置未处于启用状态
<a name="w2ab1c40c15c13b5"></a>

如果**启用私有 DNS 名称**处于启用状态，则无法激活从该 VPC 到公有端点的任何网关。

**要禁用 DNS 名称选项，请执行以下操作：**

1. 打开 [Amazon VPC 控制台](https://console.aws.amazon.com//vpc/)。

1. 在导航窗格中，选择**端点**。

1. 选择 Storage Gateway VPC 端点。

1. 选择**操作**。

1. 选择**管理私有 DNS 名称**。

1. 对于**启用私有 DNS 名称**，清除**为此端点启用**。

1. 选择**修改私有 DNS 名称**来保存设置。

# 排查本地网关问题
<a name="troubleshooting-on-premises-gateway-issues"></a>

您可以在下面找到有关在使用本地网关时可能遇到的典型问题以及如何激活 支持 以帮助排除网关故障的信息。

下表列出了您在使用场内网关时可能遇到的典型问题。


| 问题 | 要采取的操作 | 
| --- | --- | 
| 您找不到网关的 IP 地址。  |  请使用管理程序客户端连接主机，以便查找网关 IP 地址。 [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/tgw/troubleshooting-on-premises-gateway-issues.html) 如果您仍然难以找到网关 IP 地址： [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/tgw/troubleshooting-on-premises-gateway-issues.html)  | 
| 您遇到了网络或防火墙问题。  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/tgw/troubleshooting-on-premises-gateway-issues.html)  | 
|  当您单击 Storage Gateway 管理控制台中的**继续激活**按钮时，网关的激活过程会失败。  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/tgw/troubleshooting-on-premises-gateway-issues.html)  | 
| 您需要移除分配为上传缓冲区空间的磁盘。例如，您可能希望减少网关的上传缓冲区空间大小，或者可能需要替换已发生故障的用作上传缓冲区的磁盘。  | 有关移除分配为上传缓冲区的磁盘的说明，请参阅[从网关中移除磁盘](add-remove-disks.md)  | 
|  您需要提高网关和 AWS之间的带宽。  |  您可以将互联网连接设置为 AWS 与连接应用程序和网关 VM 的网卡 (NIC) 分开的网络适配器 (NIC)，从而 AWS 改善从网关到的带宽。如果您有高带宽连接， AWS 并且想要避免带宽争用，尤其是在快照还原期间，则采用这种方法很有用。对于高吞吐量工作负载需求，您可以使用 [Direct Connect](https://aws.amazon.com/directconnect/) 在本地网关和 AWS间建立专用网络连接。要测量从您的网关到的连接带宽 AWS，请使用网关的`CloudBytesDownloaded`和`CloudBytesUploaded`指标。有关本主题的更多信息，请参阅 [测量您的磁带网关和之间的性能 AWS](PerfGatewayAWS-vtl-common.md)。提高 Internet 连接性能有助于确保您的上传缓冲区不被填满。  | 
|  往返您网关的吞吐量将为零。  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/tgw/troubleshooting-on-premises-gateway-issues.html) 您可以从 Amazon CloudWatch 控制台查看进出网关的吞吐量。有关测量进出网关的吞吐量的更多信息 AWS，请参阅[测量您的磁带网关和之间的性能 AWS](PerfGatewayAWS-vtl-common.md)。  | 
|  在 Microsoft Hyper-V 中导入（部署）Storage Gateway 时遇到问题。  |  请参阅 [排查 Microsoft Hyper-V 设置](troubleshooting-hyperv-setup.md)，其中对您在 Microsoft Hyper-V 上部署网关时遇到的部分常见问题进行了说明。  | 
|  您收到一条消息，指出“已写入网关卷中的数据未安全存储在 AWS中”。  |  如果您的网关虚拟机是从另一个网关虚拟机的克隆或快照创建的，则您会收到此消息。如果不是这种情况，请联系 支持。  | 

## 允许帮助 支持 对本地托管的网关进行故障排除
<a name="enable-support-access-on-premises"></a>

Storage Gateway 提供了一个本地控制台，您可以使用它来执行多项维护任务，包括激活 支持 以访问网关以帮助您解决网关问题。默认情况下，对您的网关的 支持 访问处于停用状态。您可通过主机的本地控制台来实现此访问。要 支持 访问您的网关，请先登录主机的本地控制台，导航到 Storage Gateway 的控制台，然后连接到支持服务器。

**允许 支持 访问您的网关**

1. 登录到主机的本地控制台。
   + VMware ESXi — 有关更多信息，请参阅[使用访问网关本地控制台 VMware ESXi](accessing-local-console.md#MaintenanceConsoleWindowVMware-common)。
   + Microsoft Hyper-V - 有关更多信息，请参阅[使用 Microsoft Hyper-V 访问网关本地控制台](accessing-local-console.md#MaintenanceConsoleWindowHyperV-common)。

1. 在提示符处输入相应的数字来选择**网关控制台**。

1. 输入 **h** 打开可用命令的列表。

1. 

   请执行以下操作之一：
   + 如果网关使用的是公有端点，请在**可用命令**窗口中，输入 **open-support-channel** 来连接到 Storage Gateway 的客户支持。允许 TCP 端口 22，以便您可以打开 AWS的支持通道。在连接到客户支持时，Storage Gateway 将为您分配支持编号。请记下您的支持编号。
   + 如果网关使用的是 VPC 端点，请在 **AVAILABLE COMMANDS** 窗口中，输入 **open-support-channel**。如果未激活网关，请提供要连接到 Storage Gateway 客户支持的 VPC 端点或 IP 地址。允许 TCP 端口 22，以便您可以打开 AWS的支持通道。在连接到客户支持时，Storage Gateway 将为您分配支持编号。请记下您的支持编号。
**注意**  
信道号不是（传输控制Protocol/User Datagram Protocol (TCP/UDP）端口号。相反，网关会与 Storage Gateway 服务器建立 Secure Shell (SSH) (TCP 22) 连接，并提供用于连接的支持通道。

1. 建立支持渠道后，请向提供您的支持服务号码， 支持 支持 以便提供故障排除帮助。

1. 在支持会话完成后，输入 **q** 以将其结束。在 Amazon Web Services Support 通知您支持会话完成之前，请勿关闭该会话。

1. 输入**exit**以注销网关控制台。

1. 按照提示操作退出本地控制台。

# 排查 Microsoft Hyper-V 设置
<a name="troubleshooting-hyperv-setup"></a>

下表列出了您在 Microsoft Hyper-V 平台上部署 Storage Gateway 时可能遇到的典型问题。


| 问题 | 要采取的操作 | 
| --- | --- | 
| 您尝试导入网关并收到以下错误消息： “尝试导入虚拟机时发生服务器错误。导入失败。在位置 […] 下找不到虚拟机导入文件。仅当使用 Hyper-V 创建和导出虚拟机时，才能导入虚拟机。”  |  出现此错误的原因如下： [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/tgw/troubleshooting-hyperv-setup.html)  | 
|  您尝试导入网关并收到以下错误消息： “尝试导入虚拟机时发生服务器错误。导入失败。导入任务无法从 [...] 复制文件：文件存在。（0x80070050）”  |  如果您已经部署网关且试图重新使用存储了虚拟硬盘文件和虚拟机配置文件的默认文件夹，那么会出现此错误。要修复此问题，请在 **Hyper-V 设置**对话框左侧面板的**服务器**下方指定新位置。  | 
|  您尝试导入网关并收到以下错误消息： “尝试导入虚拟机时发生服务器错误。导入失败。Import failed because the virtual machine must have a new identifier。Select a new identifier and try the import again.”  |  导入网关时，请确保在**导入虚拟机**对话框中选择**复制虚拟机**选项并选中**复制所有文件**框，来为 VM 创建新的唯一 ID。  | 
|  您尝试启动网关 VM 并收到以下错误消息： “尝试启动选定的虚拟机时出错。子分区处理器设置与父分区不兼容。‘AWS-Storage-Gateway’无法初始化。（虚拟机 ID [...]）”  | 此错误可能是由于网关所需的 CPU 与主机 CPUs 上可用 CPUs 的 CPU 差异造成的。确保 VM 的 CPU 个数获得了底层管理程序的支持。 有关 Storage Gateway 要求的更多信息，请参阅[设置磁带网关的要求](Requirements.md)。 | 
|  您尝试启动网关 VM 并收到以下错误消息： “尝试启动选定的虚拟机时出错。‘AWS-Storage-Gateway’无法初始化。（虚拟机 ID [...]）无法创建分区：系统资源不足，无法完成所请求的服务。（0x800705AA）”  |  此错误很可能是该网关所需的 RAM 和主机上可用的 RAM 之间的差异导致的。 有关 Storage Gateway 要求的更多信息，请参阅[设置磁带网关的要求](Requirements.md)。  | 
|  您的快照和网关软件更新的出现时间会与预计的稍有不同。  |  网关 VM 的时钟可能会偏离实际的时间，这称为时钟漂移。使用本地网关控制台的时间同步选项，校验和纠正 VM 的时间。有关更多信息，请参阅 [将 VM 时间与 Hyper-V 或 Linux KVM 主机时间同步](MaintenanceTimeSync-hyperv.md)。  | 
|  您需要将解压缩的 Microsoft Hyper-V Storage Gateway 文件放入主机文件系统中。  |  按照访问典型 Microsoft Windows 服务器的方式访问主机。例如，如果虚拟机监控程序主机名为 `hyperv-server`，则可使用以下 UNC 路径 `\\hyperv-server\c$`，其中假定可解析名称 `hyperv-server`，或在本地 hosts 文件中定义了该名称。  | 
|  在连接管理程序时，系统会提示您输入证书。  |  以本地管理员的身份使用 Sconfig.cmd 工具给管理程序主机添加用户证书。  | 
|  如果对使用 Broadcom 网络适配器的 Hyper-V 主机开启虚拟机队列（VMQ），则可能会注意到网络性能不佳。  |  有关解决方法的信息，请参阅 Microsoft 文档：[Poor network performance on virtual machines on a Windows Server 2012 Hyper-V host if VMQ is turned on](https://learn.microsoft.com/en-us/troubleshoot/windows-server/networking/poor-network-performance-hyper-v-host-vm)。  | 

# 排查 Amazon EC2 网关问题
<a name="troubleshooting-EC2-gateway-issues"></a>

在以下部分中，您可以找到在使用部署到 Amazon EC2 的网关时可能遇到的典型问题。若要详细了解本地网关和 Amazon EC2 中部署的网关之间的区别，请参阅 [为磁带网关部署自定义的 Amazon EC2 实例](ec2-gateway-common.md)。

**Topics**
+ [过了一会儿您的网关并未激活](#activation-issues)
+ [您在实例列表中找不到 EC2 网关实例](#find-instance)
+ [您创建了一个 Amazon EBS 卷，但无法将其附加到 EC2 网关实例](#ebs-volume-issue)
+ [您在尝试添加存储卷时收到一条消息称“无可用磁盘”](#no-disk)
+ [您希望删除一个分配为上传缓冲区空间的磁盘来减少上传缓冲区空间](#uploadbuffer-issue)
+ [进出 EC2 网关的吞吐量降为零](#gateway-throughput-issue)
+ [您 支持 想帮忙排除 EC2 网关故障](#EC2-EnableAWSSupportAccess)
+ [您需要使用 Amazon EC2 Serial Console 连接到您的网关实例](#ec2-serial-console)

## 过了一会儿您的网关并未激活
<a name="activation-issues"></a>

在 Amazon EC2 控制台中检查以下项：
+ 已在与实例关联的安全组中激活端口 80。有关添加安全组规则的更多信息，请参阅《Amazon EC2 用户指南》**中的[添加安全组规则](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-security-groups.html#adding-security-group-rule)。
+ 网关实例会标记为“running”。在 Amazon EC2 控制台中，实例的**状态**应该是“正在运行”。
+ 确保您的 Amazon EC2 实例类型满足最低要求，如[存储需求](Requirements.md#requirements-storage)中所述。

纠正该问题后，请尝试重新激活网关。为此，请打开 Storage Gateway 控制台，选择**在 Amazon EC2 上部署新网关**，然后重新输入实例的 IP 地址。

## 您在实例列表中找不到 EC2 网关实例
<a name="find-instance"></a>

如果您没有为您的实例赋予资源标签，并且有很多实例在运行，则很难分辨哪个实例是您启动的。在这种情况下，可执行以下操作来查找网关实例：
+ 检查实例**说明**选项卡上的 Amazon 系统映像 (AMI) 名称。基于 Storage Gateway AMI 的实例应以 **aws-storage-gateway-ami** 文本开头。
+ 如果您有几个实例基于 Storage Gateway AMI，请查看实例启动时间来找到正确的实例。

## 您创建了一个 Amazon EBS 卷，但无法将其附加到 EC2 网关实例
<a name="ebs-volume-issue"></a>

检查讨论中的 Amazon EBS 卷是否与网关实例在同一可用区中。如果在不同的可用区，请在您的实例所在的可用区中创建一个新的 Amazon EBS 卷。

## 您在尝试添加存储卷时收到一条消息称“无可用磁盘”
<a name="no-disk"></a>

没有为新激活的网关定义卷存储。在定义卷存储之前，必须将本地磁盘分配给网关，以便用作上传缓冲区和缓冲存储空间。对于部署到 Amazon EC2 的网关，本地磁盘是附加到实例的 Amazon EBS 卷。出现这个错误消息很可能是因为没有为实例定义 Amazon EBS 卷。

查看为运行网关的实例所定义的块储存设备。如果只存在两个数据块储存设备 (AMI 附带的默认设备)，那么应该增加存储。有关执行此操作的更多信息，请参阅 [为磁带网关部署自定义的 Amazon EC2 实例](ec2-gateway-common.md)。在附加两个或两个以上的 Amazon EBS 卷后，尝试在网关上创建卷存储。

## 您希望删除一个分配为上传缓冲区空间的磁盘来减少上传缓冲区空间
<a name="uploadbuffer-issue"></a>

按照 [确定要分配的上传缓冲区的大小](decide-local-disks-and-sizes.md#CachedLocalDiskUploadBufferSizing-common) 中的步骤操作。

## 进出 EC2 网关的吞吐量降为零
<a name="gateway-throughput-issue"></a>

验证网关实例是否在运行。例如，如果实例因系统重启而处于启动过程中，请等待该实例完成重启。

另外，验证网关 IP 是否改变。如果实例已停止，然后重新启动，那么实例的 IP 地址可能会发生更改。在这种情况下，您必须激活新的网关。

您可以从 Amazon CloudWatch 控制台查看进出网关的吞吐量。有关测量进出网关的吞吐量的更多信息 AWS，请参阅[测量您的磁带网关和之间的性能 AWS](PerfGatewayAWS-vtl-common.md)。

## 您 支持 想帮忙排除 EC2 网关故障
<a name="EC2-EnableAWSSupportAccess"></a>

Storage Gateway 提供了一个本地控制台，您可以使用它 支持 来执行多项维护任务，包括激活访问网关以帮助您解决网关问题。默认情况下，对您的网关的 支持 访问处于停用状态。通过 Amazon EC2 本地控制台来提供此访问。通过 Secure Shell (SSH) 登录到 Amazon EC2 本地控制台。要通过 SSH 成功登录，您的实例的安全组必须具有开放 TCP 端口 22 的规则。

**注意**  
如果将新规则添加到现有安全组，则新规则适用于使用该安全组的所有实例。有关安全组以及如何添加安全组规则的更多信息，请参阅**《Amazon EC2 用户指南》中的 [Amazon EC2 安全组](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-network-security.html)。

要 支持 连接您的网关，您需要先登录 Amazon EC2 实例的本地控制台，导航到存储网关的控制台，然后提供访问权限。

**激活对部署在 Amazon EC2 实例上的网关的 支持 访问权限**

1. 登录到 Amazon EC2 实例的本地控制台。有关说明，请转到**《Amazon EC2 用户指南》中的[连接到您的实例](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/AccessingInstances.html)。

   您可使用以下命令登录到 EC2 实例的本地控制台。

   ```
   ssh –i PRIVATE-KEY admin@INSTANCE-PUBLIC-DNS-NAME
   ```
**注意**  
*PRIVATE-KEY*是包含您用于启动 Amazon EC2 实例的 EC2 密钥对的私有证书的`.pem`文件。有关更多信息，请参阅**《Amazon EC2 用户指南》中的[检索密钥对的公有密钥](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-key-pairs.html#retriving-the-public-key)。  
*INSTANCE-PUBLIC-DNS-NAME*是运行网关的 Amazon EC2 实例的公有域名系统 (DNS) 名称。可通过在 EC2 控制台中选择 Amazon EC2 实例并单击**说明**选项卡来获取此公有 DNS 名称。

1. 在提示符处，输入 **6 - Command Prompt** 来打开 支持 通道控制台。

1. 输入 **h** 以打开 **AVAILABLE COMMANDS** 窗口。

1. 请执行以下操作之一：
   + 如果网关使用的是公有端点，请在**可用命令**窗口中，输入 **open-support-channel** 来连接到 Storage Gateway 的客户支持。允许 TCP 端口 22，以便您可以打开 AWS的支持通道。在连接到客户支持时，Storage Gateway 将为您分配支持编号。请记下您的支持编号。
   + 如果网关使用的是 VPC 端点，请在 **AVAILABLE COMMANDS** 窗口中，输入 **open-support-channel**。如果未激活网关，请提供要连接到 Storage Gateway 客户支持的 VPC 端点或 IP 地址。允许 TCP 端口 22，以便您可以打开 AWS的支持通道。在连接到客户支持时，Storage Gateway 将为您分配支持编号。请记下您的支持编号。
**注意**  
信道号不是（传输控制Protocol/User Datagram Protocol (TCP/UDP）端口号。相反，网关会与 Storage Gateway 服务器建立 Secure Shell (SSH) (TCP 22) 连接，并提供用于连接的支持通道。

1. 建立支持渠道后，请向提供您的支持服务号码， 支持 支持 以便提供故障排除帮助。

1. 在支持会话完成后，输入 **q** 以将其结束。在 支持 通知您支持会话已完成之前，请勿关闭会话。

1. 输入 **exit** 来退出 Storage Gateway 控制台。

1. 通过控制台菜单操作来注销 Storage Gateway 实例。

## 您需要使用 Amazon EC2 Serial Console 连接到您的网关实例
<a name="ec2-serial-console"></a>

您可以使用 Amazon EC2 Serial Console 来排查引导、网络配置和其他问题。有关说明和故障排除提示，请参阅《Amazon Elastic Compute Cloud 用户指南》**中的 [Amazon EC2 Serial Console](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-serial-console.html)。

# 排查硬件设备问题
<a name="troubleshooting-hardware-appliance-issues"></a>

以下主题介绍了您可能遇到的 Storage Gateway 硬件设备问题以及排查这些问题的建议。

## 您无法确定服务 IP 地址
<a name="service_ip_address"></a>

当尝试连接到您的服务时，请确保您使用的是该服务的 IP 地址，而不是主机的 IP 地址。在服务控制台中配置服务 IP 地址，并在硬件控制台中配置主机 IP 地址。您将在启动硬件设备时看到硬件控制台。要从硬件控制台转到服务控制台，请选择 **Open Service Console (打开服务控制台)**。

## 如何执行出厂重置？
<a name="factory_reset"></a>

如果您需要在设备上执行出厂重置，请联系 Storage Gateway 硬件设备团队来获得支持，如后面的“支持”部分中所述。

## 如何执行远程重启？
<a name="remote-restart"></a>

如果您需要远程重启设备，可以使用 Dell iDRAC 管理界面执行此操作。有关更多信息，请参阅 Dell Technologies InfoHub 网站上的 [i DRAC9 虚拟电源循环：远程重启 Dell EMC PowerEdge 服务器](https://infohub.delltechnologies.com/en-us/p/idrac9-virtual-power-cycle-remotely-power-cycle-dell-emc-poweredge-servers/)。

## 您在何处获得 Dell iDRAC 支持？
<a name="iDRAC_support"></a>

戴尔 PowerEdge 服务器配有戴尔iDRAC管理接口。我们建议执行下列操作：
+ 如果您使用 iDRAC 管理界面，则应更改默认密码。有关iDRAC凭证的更多信息，[请参阅 PowerEdge 戴尔——iDRAC的默认登录凭据是什么？](https://www.dell.com/support/article/en-us/sln306783/dell-poweredge-what-is-the-default-username-and-password-for-idrac?lang=en) 。
+ 确保固件是 up-to-date为了防止安全漏洞。
+ 将 iDRAC 网络接口移动到正常的 (`em`) 端口可能会导致性能问题或阻止设备正常运行。

## 您找不到硬件设备序列号
<a name="appliance_serial_number"></a>

可以使用 Storage Gateway 控制台查找 Storage Gateway 硬件设备的序列号。

**查找硬件设备序列号：**

1. 在[https://console.aws.amazon.com/storagegateway/家](https://console.aws.amazon.com/storagegateway/)中打开 Storage Gateway 控制台。

1. 从页面左侧的导航菜单中选择**硬件**。

1. 从列表中选择硬件设备。

1. 在设备的**详细信息**选项卡上找到**序列号**字段。

## 在何处获得硬件设备支持
<a name="appliance_support"></a>

 AWS 要联系您的硬件设备的技术支持，请参阅[支持](https://aws.amazon.com/contact-us)。

该 支持 团队可能会要求您激活支持渠道，以远程解决您的网关问题。您无需打开此端口即可实现网关的正常操作，但在进行问题排查时需要打开。您可以从硬件控制台激活支持通道，如下面的过程所示。

**要打开支持渠道 AWS**

1. 打开硬件控制台。

1. 选择硬件控制台主页底部的**打开支持渠道**，然后按 `Enter`。

   如果没有网络连接或防火墙问题，分配的端口号应该在 30 秒内出现。例如：

   **状态：在端口 19599 上打开**

1. 记下端口号并将其提供给 支持。

# 对虚拟磁带问题进行故障排除
<a name="Main_TapesIssues-vtl"></a>

您可以在下面找到有关您遇到虚拟磁带意外问题时要采取的措施的信息。

**Topics**
+ [从无法恢复的网关恢复虚拟磁带](#recovery-tapes)
+ [排查无法恢复的磁带的问题](#IrrecoverableTapes)
+ [高可用性运行状况通知](#troubleshooting-ha-notifications)

## 从无法恢复的网关恢复虚拟磁带
<a name="recovery-tapes"></a>

虽然很少发生，但您的磁带网关仍可能会遇到不可恢复的故障。此类故障可能发生在您的虚拟机管理程序主机、网关本身或缓存磁盘中。如果发生故障，您可以遵照本节中的故障排除说明来恢复磁带。

**Topics**
+ [您需要从发生故障的磁带网关恢复虚拟磁带](#creating-recovery-tape-vtl)
+ [您需要从发生故障的缓存磁盘恢复虚拟磁带](#recover-from-failed-disk)

### 您需要从发生故障的磁带网关恢复虚拟磁带
<a name="creating-recovery-tape-vtl"></a>

如果您的磁带网关或虚拟机管理程序主机遇到无法恢复的故障，则可以恢复已上传 AWS 到另一个磁带网关的任何数据。

注意，写入到磁带的数据可能不会全部上传，直到该磁带成功存档到 VTS。以这种方式恢复到另一个网关的磁带数据可能不完整或空白。我们建议在所有恢复的磁带上建立清单，确保它们包含所需的内容。

**将磁带恢复到另一个磁带网关**

1. 指定一个正常运行的现有磁带网关来充当您的恢复目标网关。如果您没有可将磁带恢复到的磁带网关，请创建新的磁带网关。有关如何创建网关的信息，请参阅[创建网关](https://docs.aws.amazon.com/storagegateway/latest/tgw/create-gateway-vtl.html)。

1. 在[https://console.aws.amazon.com/storagegateway/家](https://console.aws.amazon.com/storagegateway/)中打开 Storage Gateway 控制台。

1. 在导航窗格中，选择**网关**，然后选择您要从中恢复磁带的磁带网关。

1. 选择**详细信息**选项卡。此时选项卡上将显示磁带恢复消息。

1. 选择**创建恢复磁带**来停用网关。

1. 在显示的对话框中，选择 **Disable gateway**。

   这个过程会永久终止磁带网关的正常功能，并公开所有可用的恢复点。有关说明，请参阅[停用磁带网关](https://docs.aws.amazon.com/storagegateway/latest/tgw/disabling-gateway-vtl.html)。

1. 从已停用网关显示的磁带中，选择虚拟磁带和要恢复的恢复点。一个虚拟磁带可有多个恢复点。

1. 要开始将所需的任何磁带恢复到目标磁带网关，请选择**创建恢复磁带**。

1. 在 **Create recovery tape** 对话框中，验证要恢复的虚拟磁带的条码。

1. 对于**网关**，选择要将虚拟磁带恢复到的磁带网关。

1. 选择 **Create recovery tape**。

1. 删除发生故障的磁带网关，以免向您收费。有关说明，请参阅[删除网关和移除关联的资源](deleting-gateway-common.md)。

Storage Gateway 将磁带从出现故障的磁带网关移动到您指定的磁带网关。磁带网关将磁带状态标记为“已恢复”。

### 您需要从发生故障的缓存磁盘恢复虚拟磁带
<a name="recover-from-failed-disk"></a>

如果您的缓存磁盘遇到错误，则该网关会阻止对其中的虚拟磁带执行读写操作。例如，当磁盘损坏或从网关中移除时，可能发生错误。Storage Gateway 控制台将显示有关该错误的消息。

在该错误消息中，Storage Gateway 会提示您执行可以恢复磁带的两种操作之一：
+  **关闭并重新添加磁盘** - 如果磁盘的数据未变但已移除磁盘，则采用此方法。例如，如果由于意外从主机移除了磁盘而导致发生错误，但磁盘和数据未变，则您可以重新添加该磁盘。要执行此操作，请参阅本主题后文中的过程。
+  **重置缓存磁盘** - 如果缓存磁盘损坏或无法访问，则采用此方法。如果因磁盘错误导致缓存磁盘不可访问、无法使用或损坏，您可重置该磁盘。如果重置缓存磁盘，则您可以继续使用包含干净数据的磁带（即其缓存磁盘中的数据和 Amazon S3 中的数据已同步的磁带）。但是，其中包含的数据未与 Amazon S3 同步的磁带将自动恢复。这些磁带的状态将设置为 RECOVERED，但磁带将为只读。有关如何从主机中移除磁盘的信息，请参阅[确定要分配的上传缓冲区的大小](decide-local-disks-and-sizes.md#CachedLocalDiskUploadBufferSizing-common)。
**重要**  
如果您要重置的缓存磁盘包含还未上传到 Amazon S3 的数据，则这些数据可能丢失。重置缓存磁盘以后，网关中将不再有已配置的缓存磁盘，因此，为了让网关能够正常工作，您必须至少配置一个新的缓存磁盘。

  要重置缓存磁盘，请参阅本主题下文中的过程。

**关闭再重新添加磁盘**

1. 关闭网关。有关如何关闭网关的信息，请参阅[关闭网关虚拟机](MaintenanceShutDown-common.md)。

1. 将磁盘重新添加到主机，并确保磁盘的磁盘节点号未发生改变。有关如何添加磁盘的信息，请参阅[确定要分配的上传缓冲区的大小](decide-local-disks-and-sizes.md#CachedLocalDiskUploadBufferSizing-common)。

1. 重新启动网关。有关如何重新启动网关的信息，请参阅[关闭网关虚拟机](MaintenanceShutDown-common.md)。

网关重新启动以后，您可验证缓存磁盘的状态。磁盘可能处于以下状态之一：
+ **存在** - 磁盘可供使用。
+ **缺失** - 磁盘不再与网关相连接。
+ **不匹配** - 磁盘节点被包含不正确元数据的磁盘占用，或磁盘内容已损坏。

**重置和重新配置缓存磁盘**

1. 在前面阐明的 **A disk error has occurred** 错误消息中，选择 **Reset Cache Disk**。

1. 在**配置网关**页面中，为缓存存储配置磁盘。有关如何配置的信息，请参阅[配置磁带网关](https://docs.aws.amazon.com/storagegateway/latest/tgw/create-gateway-vtl.html#configure-gateway-tape)。

1. 配置缓存存储后，关闭并重启网关，如上一过程所述。

网关重新启动后应该就会恢复。然后，您可以验证缓存磁盘的状态。

**验证缓存磁盘的状态**

1. 在[https://console.aws.amazon.com/storagegateway/家](https://console.aws.amazon.com/storagegateway/)中打开 Storage Gateway 控制台。

1. 在导航窗格中，选择 **Gateways**，然后选择您的网关。

1. 对于 **Actions (操作)**，选择 **Configure Local Storage (配置本地存储)** 以显示 **Configure Local Storage (配置本地存储)** 对话框。此对话框将显示网关中的所有本地磁盘。

缓存磁盘节点状态显示在磁盘旁边。

**注意**  
如果您没有完成恢复过程，则网关会显示一个横幅，提示您配置本地存储。

## 排查无法恢复的磁带的问题
<a name="IrrecoverableTapes"></a>

如果您的虚拟磁带出现意外故障，Storage Gateway 会将出现故障的虚拟磁带的状态设为“不可恢复”。要采取的操作视情况而定。您可以在下面找到有关您可能会发现的一些问题以及如何对这些问题进行故障排除的信息。

### 您需要从无法恢复的磁带恢复数据
<a name="IrrecoverableTapes.NeedTape"></a>

如果您的虚拟磁带状态为 IRRECOVERABLE 且您需要使用该磁带，请尝试以下操作之一：
+ 如果还没有激活磁带网关，请激活一个新的磁带网关。有关更多信息，请参阅[创建网关](https://docs.aws.amazon.com/storagegateway/latest/tgw/create-gateway-vtl.html)。
+ 停用包含不可恢复磁带的磁带网关，将磁带从恢复点恢复到新的磁带网关。有关更多信息，请参阅 [您需要从发生故障的磁带网关恢复虚拟磁带](#creating-recovery-tape-vtl)。
**注意**  
您必须重新配置 iSCSI 启动程序和备份应用程序才能使用新的磁带网关。有关更多信息，请参阅 [连接 VTL 设备](GettingStartedAccessTapesVTL.md)。

### 您不需要未存档的状态为 IRRECOVERABLE 的磁带
<a name="IrrecoverableTapes.DoNotNeedNotArchived"></a>

如果您有一个状态为 IRRECOVERABLE 的虚拟磁带，您不需要该磁带，且该磁带从未进行存档，则您应删除该磁带。有关更多信息，请参阅 [从磁带网关中删除虚拟磁带](deleting-tapes-vtl.md)。

### 您网关中的一个缓存磁盘遇到了故障
<a name="IrrecoverableTapes.CacheFails"></a>

如果网关中的一个或多个缓存磁盘出现故障，则该网关会阻止对虚拟磁带执行读写操作。要恢复正常功能，请按如下所述重新配置网关：
+ 如果缓存磁盘无法访问或不可用，请从网关配置中删除该磁盘。
+ 如果缓存磁盘仍然可以访问和使用，请将其重新连接到您的网关。

**注意**  
如果删除缓存磁盘，则当网关恢复正常功能时，拥有干净数据的磁带或卷（即其缓存磁盘中的数据和 Amazon S3 中的数据已同步）将继续可用。例如，如果您的网关有三个缓存磁盘，而您删除了两个缓存磁盘，则干净的磁带或卷将处于“可用”状态。其他磁带和卷将处于“不可恢复”状态。  
如果您使用临时磁盘作为网关的缓存磁盘或将缓存磁盘装载到临时驱动器，则关闭网关时缓存磁盘将丢失。在缓存磁盘和 Amazon S3 未同步时关闭网关会导致数据丢失。因此，我们不建议使用临时驱动器或磁盘。

## 高可用性运行状况通知
<a name="troubleshooting-ha-notifications"></a>

在 VMware vSphere 高可用性 (HA) 平台上运行网关时，您可能会收到运行状况通知。有关运行状况通知的更多信息，请参阅[排查高可用性问题](troubleshooting-ha-issues.md)。

# 排查高可用性问题
<a name="troubleshooting-ha-issues"></a>

如果您遇到可用性问题，则可在下面查找有关要采取的操作的信息。

**Topics**
+ [运行状况通知](#ha-health-notifications)
+ [指标](#ha-health-notification-metrics)

## 运行状况通知
<a name="ha-health-notifications"></a>

当您在 VMware vSphere HA 上运行网关时，所有网关都会向您配置的 Amazon CloudWatch 日志组生成以下运行状况通知。这些通知将转至名为 `AvailabilityMonitor` 的日志流中。

**Topics**
+ [通知：重启](#troubleshoot-reboot-notification)
+ [通知： HardReboot](#troubleshoot-hardreboot-notification)
+ [通知： HealthCheckFailure](#troubleshoot-healthcheckfailure-notification)
+ [通知： AvailabilityMonitorTest](#troubleshoot-availabilitymonitortest-notification)

### 通知：重启
<a name="troubleshoot-reboot-notification"></a>

在重新启动网关 VM 时，您会收到重启通知。您可以使用 VM 管理程序管理控制台或 Storage Gateway 控制台重新启动网关 VM。您也可以在网关维护周期内使用网关软件来重新启动。

**措施**

如果重启时间在网关的已配置[维护开始时间](MaintenanceManagingUpdate-common.md)的 10 分钟内，则此情况可能是正常的，并不指示任何问题。如果重启发生在维护时段之外，请检查是否已手动重新启动网关。

### 通知： HardReboot
<a name="troubleshoot-hardreboot-notification"></a>

当网关 VM 意外重启时，您会收到 `HardReboot` 通知。此类重启可能是因断电、硬件故障或其他事件导致的。对于 VMware 网关，vSphere 高可用性应用程序监控的重置可以启动此事件。

**措施**

当您的网关在这样的环境中运行时，请检查`HealthCheckFailure`通知是否存在，并查阅虚拟机 VMware 的事件日志。

### 通知： HealthCheckFailure
<a name="troubleshoot-healthcheckfailure-notification"></a>

对于 VMware vSphere HA 上的网关，当运行状况检查失败并请求重启虚拟机时，您可以收到`HealthCheckFailure`通知。此事件也会在测试期间发生来监控可用性（由 `AvailabilityMonitorTest` 通知指示）。在此情况下，应会有 `HealthCheckFailure` 通知。

**注意**  
此通知仅适用于 VMware 网关。

**措施**

如果此事件重复发生，但没有 `AvailabilityMonitorTest` 通知，请检查您的 VM 基础设施是否存在问题（存储、内存等）。如果您需要其他帮助，请联系 支持。

### 通知： AvailabilityMonitorTest
<a name="troubleshoot-availabilitymonitortest-notification"></a>

对于 VMware vSphere HA 上的网关，当您在中[运行[可用性和应用程序监控](https://docs.aws.amazon.com/storagegateway/latest/APIReference/API_StartAvailabilityMonitorTest.html)系统测试](vmware-ha.md#vmware-ha-test-failover)时，您会`AvailabilityMonitorTest`收到通知。 VMware

## 指标
<a name="ha-health-notification-metrics"></a>

`AvailabilityNotifications` 指标适用于所有网关。此指标是网关生成的与可用性相关的运行状况通知数。使用 `Sum` 统计数据可观察网关是否遇到了任何与可用性相关的事件。有关事件的详细信息，请咨询您配置的 CloudWatch 日志组。