

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 排查网关问题
<a name="troubleshooting-gateway-issues"></a>

接下来，可以查找有关与网关、主机平台、卷、高可用性、数据恢复和快照相关的最佳实践以及问题故障排除的信息。本地网关故障排除信息涵盖部署在支持的虚拟化平台上的网关。高可用性问题的故障排除信息涵盖在 VMware vSphere 高可用性 (HA) 平台上运行的网关。

**主题**
+ [故障排除：网关离线问题](troubleshooting-gateway-offline.md)：了解如何诊断可能导致网关在 Storage Gateway 控制台中显示为离线的问题。
+ [故障排除：网关激活期间的内部错误](troubleshooting-gateway-activation.md)：了解在尝试激活 Storage Gateway 时收到内部错误消息的情况下该怎么做。
+ [排查本地网关问题](troubleshooting-on-premises-gateway-issues.md)-了解在使用本地网关时可能遇到的典型问题，以及如何允许 支持 连接到网关以帮助进行故障排除。
+ [排查 Microsoft Hyper-V 设置](troubleshooting-hyperv-setup.md)：了解您在 Microsoft Hyper-V 平台上部署 Storage Gateway 时可能遇到的典型问题。
+ [排查 Amazon EC2 网关问题](troubleshooting-EC2-gateway-issues.md)-查找有关您在使用部署在 Amazon 上的网关时可能遇到的典型问题的信息 EC2。
+ [排查硬件设备问题](troubleshooting-hardware-appliance-issues.md)：了解如何解决您可能遇到的有关 Storage Gateway 硬件设备的问题。
+ [排查卷问题](troubleshoot-volume-issues.md)：查找有关您使用卷时可能遇到的最典型问题，以及我们建议您采取的问题解决措施的信息。
+ [排查高可用性问题](troubleshooting-ha-issues.md)-了解在 VMware HA 环境中部署的网关遇到问题时该怎么做。

# 故障排除：网关离线问题
<a name="troubleshooting-gateway-offline"></a>

使用以下故障排除信息，来确定当 AWS Storage Gateway 控制台显示网关处于离线状态时该怎么做。

网关可能由于以下一个或多个原因而显示为离线：
+ 网关无法到达 Storage Gateway 服务端点。
+ 网关意外关闭。
+ 与网关关联的缓存磁盘已断开连接或经过修改，或者出现故障。

要使网关恢复在线，请确定并解决导致网关离线的问题。

## 检查关联的防火墙或代理
<a name="w2ab1c40c12c11"></a>

如果您将网关配置为使用代理，或者将网关置于防火墙后面，请查看代理或防火墙的访问规则。代理或防火墙必须可让流量进出 Storage Gateway 所需的网络端口和服务端点。有关更多信息，请参阅 [Network and firewall requirements](https://docs.aws.amazon.com/storagegateway/latest/vgw/Requirements.html#networks)。

## 检查是否正在对网关的流量进行 SSL 检查或深度数据包检查
<a name="w2ab1c40c12c13"></a>

如果当前正在对网关与之间的网络流量执行 SSL 或深度数据包检查 AWS，则您的网关可能无法与所需的服务端点通信。要使网关恢复在线，必须禁用检查。

## 检查虚拟机监控程序主机上是否出现停电或硬件故障
<a name="w2ab1c40c12c17"></a>

网关的虚拟机监控程序主机出现停电或硬件故障，可能会导致网关意外关闭且无法访问。在恢复电源和网络连接后，网关将再次变为可访问。

网关恢复在线后，请务必采取措施来恢复数据。有关更多信息，请参阅 [Best practices for recovering your data](https://docs.aws.amazon.com/storagegateway/latest/vgw/recover-data-from-gateway.html)。

## 检查关联的缓存磁盘是否有问题
<a name="w2ab1c40c12c19"></a>

如果与网关关联的缓存磁盘中至少有一个被移除、更改或调整大小，或者它已损坏，则网关可能会进入离线状态。

**如果从虚拟机监控程序主机上移除了正常工作的缓存磁盘：**

1. 关闭网关。

1. 重新添加该磁盘。
**注意**  
确保将磁盘添加到同一个磁盘节点。

1. 重新启动网关。

**如果缓存磁盘损坏、被更换或调整大小：**

1. 关闭网关。

1. 重置缓存磁盘。

1. 重新配置磁盘以进行缓存存储。

1. 重新启动网关。

# 故障排除：网关激活期间的内部错误
<a name="troubleshooting-gateway-activation"></a>

Storage Gateway 激活请求会经过两条网络路径。客户端发送的传入激活请求通过端口 80 连接到网关的虚拟机（VM）或 Amazon Elastic Compute Cloud（Amazon EC2）实例。如果网关成功收到激活请求，则网关将与 Storage Gateway 端点通信来接收激活密钥。如果网关无法到达 Storage Gateway 端点，则网关会以一则内部错误消息响应客户端。

使用以下故障排除信息，来确定在尝试激活 AWS Storage Gateway的过程中收到内部错误消息时该怎么做。

**注意**  
确保使用最新的虚拟机映像文件或亚马逊机器映像（AMI）版本部署新的网关。如果您尝试激活使用过时 AMI 的网关，则会收到内部错误消息。
在下载 AMI 之前，请务必选择要部署的正确网关类型。每种网关类型的.ova 文件都不同，并且不可互换。 AMIs 

## 解决使用公有端点激活网关时出现的错误
<a name="w2ab1c40c15b9"></a>

要解决使用公有端点激活网关时的激活错误，请执行以下检查和配置。

### 检查所需的端口
<a name="w2ab1c40c15b9b5"></a>

对于本地部署的网关，请检查本地防火墙上的端口是否为打开状态。对于部署在 Amazon EC2 实例上的网关，请检查实例安全组上的端口是否为打开状态。要确认端口为打开状态，请从服务器上对公有端点运行 telnet 命令。此服务器必须与网关位于同一子网中。例如，以下 telnet 命令测试与端口 443 的连接：

```
telnet d4kdq0yaxexbo.cloudfront.net 443
telnet storagegateway.region.amazonaws.com 443
telnet dp-1.storagegateway.region.amazonaws.com 443
telnet proxy-app.storagegateway.region.amazonaws.com 443
telnet client-cp.storagegateway.region.amazonaws.com 443
telnet anon-cp.storagegateway.region.amazonaws.com 443
```

要确认网关本身是否可以到达端点，请访问网关的本地 VM 控制台（适用于本地部署的网关）。或者，可以通过 SSH 连接到网关的实例（适用于部署在 Amazon EC2 上的网关）。然后，运行网络连接测试。确认测试返回 `[PASSED]`。有关更多信息，请参阅 [Testing Your Gateway Connection to the Internet](https://docs.aws.amazon.com/storagegateway/latest/vgw/manage-on-premises-common.html#MaintenanceTestGatewayConnectivity-common)。

**注意**  
网关控制台的默认登录用户名为 `admin`，默认密码为 `password`。

### 确保防火墙安全性不会修改从网关发送到公有端点的数据包
<a name="w2ab1c40c15b9b7"></a>

SSL 检查、深度数据包检查或其它形式的防火墙安全性可能会干扰从网关发送的数据包。如果 SSL 证书的修改结果与激活端点所预期的情况不同，则 SSL 握手失败。要确认没有正在进行的 SSL 检查，请在端口 443 上的主激活端点 (`anon-cp.storagegateway.region.amazonaws.com`) 上运行 OpenSSL 命令。必须从与网关位于同一子网中的计算机上运行此命令：

```
$ openssl s_client -connect  anon-cp.storagegateway.region.amazonaws.com:443 -servername anon-cp.storagegateway.region.amazonaws.com
```

**注意**  
替换*region*为你的 AWS 区域。

如果没有正在进行的 SSL 检查，则该命令将返回类似于以下内容的响应：

```
$ openssl s_client -connect anon-cp.storagegateway.us-east-2.amazonaws.com:443 -servername anon-cp.storagegateway.us-east-2.amazonaws.com
CONNECTED(00000003)
depth=2 C = US, O = Amazon, CN = Amazon Root CA 1
verify return:1
depth=1 C = US, O = Amazon, OU = Server CA 1B, CN = Amazon
verify return:1
depth=0 CN = anon-cp.storagegateway.us-east-2.amazonaws.com
verify return:1
---
Certificate chain
 0 s:/CN=anon-cp.storagegateway.us-east-2.amazonaws.com
   i:/C=US/O=Amazon/OU=Server CA 1B/CN=Amazon
 1 s:/C=US/O=Amazon/OU=Server CA 1B/CN=Amazon
   i:/C=US/O=Amazon/CN=Amazon Root CA 1
 2 s:/C=US/O=Amazon/CN=Amazon Root CA 1
   i:/C=US/ST=Arizona/L=Scottsdale/O=Starfield Technologies, Inc./CN=Starfield Services Root Certificate Authority - G2
 3 s:/C=US/ST=Arizona/L=Scottsdale/O=Starfield Technologies, Inc./CN=Starfield Services Root Certificate Authority - G2
   i:/C=US/O=Starfield Technologies, Inc./OU=Starfield Class 2 Certification Authority
---
```

如果正在进行 SSL 检查，则响应将显示更改的证书链，类似于以下内容：

```
$ openssl s_client -connect  anon-cp.storagegateway.ap-southeast-1.amazonaws.com:443 -servername anon-cp.storagegateway.ap-southeast-1.amazonaws.com
CONNECTED(00000003)
depth=0 DC = com, DC = amazonaws, OU = AWS, CN = anon-cp.storagegateway.ap-southeast-1.amazonaws.com
verify error:num=20:unable to get local issuer certificate
verify return:1
depth=0 DC = com, DC = amazonaws, OU = AWS, CN = anon-cp.storagegateway.ap-southeast-1.amazonaws.com
verify error:num=21:unable to verify the first certificate
verify return:1
---
Certificate chain
 0 s:/DC=com/DC=amazonaws/OU=AWS/CN=anon-cp.storagegateway.ap-southeast-1.amazonaws.com
   i:/C=IN/O=Company/CN=Admin/ST=KA/L=New town/OU=SGW/emailAddress=admin@company.com
---
```

激活端点仅在识别 SSL 证书时才接受 SSL 握手。这意味着，网关到端点的出站流量必须免受网络中防火墙执行的检查。这些检查可能是 SSL 检查或深度数据包检查。

### 检查网关时间同步
<a name="w2ab1c40c15b9b9"></a>

时间偏差过大可能会导致 SSL 握手错误。对于本地网关，可以使用网关的本地 VM 控制台来检查网关的时间同步。时间偏差应不大于 60 秒。有关更多信息，请参阅 [Synchronizing Your Gateway VM Time](https://docs.aws.amazon.com/storagegateway/latest/vgw/MaintenanceTimeSync-hyperv.html)。

**系统时间管理**选项在托管于 Amazon EC2 实例上的网关中不可用。为确保 Amazon EC2 网关能够正确地同步时间，请确认 Amazon EC2 实例可以通过端口 UDP 和 TCP 123 连接到以下 NTP 服务器池列表：
+ 0.amazon.pool.ntp.org
+ 1.amazon.pool.ntp.org
+ 2.amazon.pool.ntp.org
+ 3.amazon.pool.ntp.org

## 解决使用 Amazon VPC 端点激活网关时出现的错误
<a name="w2ab1c40c15c11"></a>

要解决使用 Amazon Virtual Private Cloud（Amazon VPC）端点激活网关时出现的激活错误，请执行以下检查和配置。

### 检查所需的端口
<a name="w2ab1c40c15c11b5"></a>

确保本地防火墙（对于本地部署的网关）或安全组（对于部署在 Amazon EC2 中的网关）中的所需端口处于打开状态。将网关连接到 Storage Gateway VPC 端点所需的端口与将网关连接到公有端点时所需的端口不同。连接到 Storage Gateway VPC 端点需要以下端口：
+ TCP 443
+ TCP 1026
+ TCP 1027
+ TCP 1028
+ TCP 1031
+ TCP 2222

有关更多信息，请参阅 [Creating a VPC endpoint for Storage Gateway](https://docs.aws.amazon.com/storagegateway/latest/vgw/gateway-private-link.html#create-vpc-endpoint)。

此外，请检查连接到 Storage Gateway VPC 端点的安全组。连接到端点的默认安全组可能不支持所需的端口。创建一个新的安全组，让来自网关 IP 地址范围的流量通过所需端口。然后，将该安全组连接到 VPC 端点。

**注意**  
使用 [Amazon VPC 控制台](https://console.aws.amazon.com//vpc/)来验证连接到 VPC 端点的安全组。从控制台查看 Storage Gateway VPC 端点，然后选择**安全组**选项卡。

要确认所需端口处于打开状态，可以在 Storage Gateway VPC 端点上运行 telnet 命令。必须从与网关位于同一子网中的服务器上运行这些命令。可以对第一个未指定可用区的 DNS 名称运行测试。例如，以下 telnet 命令使用 DNS 名称 vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 测试所需的端口连接：

```
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 443
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 1026
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 1027
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 1028
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 1031
telnet vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com 2222
```

### 确保防火墙安全性不会修改从网关发送到 Storage Gateway Amazon VPC 端点的数据包
<a name="w2ab1c40c15c11b7"></a>

SSL 检查、深度数据包检查或其它形式的防火墙安全性可能会干扰从网关发送的数据包。如果 SSL 证书的修改结果与激活端点所预期的情况不同，则 SSL 握手失败。要确认没有正在进行的 SSL 检查，请在 Storage Gateway VPC 端点上运行 OpenSSL 命令。必须从与网关位于同一子网中的计算机上运行此命令。针对每个必需的端口运行命令：

```
$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:443 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com

$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1026 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com

$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1027 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com

$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1028 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com

$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1031 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com

$ openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:2222 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com
```

如果没有正在进行的 SSL 检查，则该命令将返回类似于以下内容的响应：

```
openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1027 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com
CONNECTED(00000005)
depth=2 C = US, O = Amazon, CN = Amazon Root CA 1
verify return:1
depth=1 C = US, O = Amazon, OU = Server CA 1B, CN = Amazon
verify return:1
depth=0 CN = anon-cp.storagegateway.us-east-1.amazonaws.com
verify return:1
---
Certificate chain
 0 s:CN = anon-cp.storagegateway.us-east-1.amazonaws.com
   i:C = US, O = Amazon, OU = Server CA 1B, CN = Amazon
 1 s:C = US, O = Amazon, OU = Server CA 1B, CN = Amazon
   i:C = US, O = Amazon, CN = Amazon Root CA 1
 2 s:C = US, O = Amazon, CN = Amazon Root CA 1
   i:C = US, ST = Arizona, L = Scottsdale, O = "Starfield Technologies, Inc.", CN = Starfield Services Root Certificate Authority - G2
 3 s:C = US, ST = Arizona, L = Scottsdale, O = "Starfield Technologies, Inc.", CN = Starfield Services Root Certificate Authority - G2
   i:C = US, O = "Starfield Technologies, Inc.", OU = Starfield Class 2 Certification Authority
---
```

如果正在进行 SSL 检查，则响应将显示更改的证书链，类似于以下内容：

```
openssl s_client -connect vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com:1027 -servername vpce-1234567e1c24a1fe9-62qntt8k.storagegateway.us-east-1.vpce.amazonaws.com
CONNECTED(00000005)
depth=2 C = US, O = Amazon, CN = Amazon Root CA 1
verify return:1
depth=1 C = US, O = Amazon, OU = Server CA 1B, CN = Amazon
verify return:1
depth=0 DC = com, DC = amazonaws, OU = AWS, CN = anon-cp.storagegateway.us-east-1.amazonaws.com
verify error:num=21:unable to verify the first certificate
verify return:1
---
Certificate chain
 0 s:/DC=com/DC=amazonaws/OU=AWS/CN=anon-cp.storagegateway.us-east-1.amazonaws.com
   i:/C=IN/O=Company/CN=Admin/ST=KA/L=New town/OU=SGW/emailAddress=admin@company.com
---
```

激活端点仅在识别 SSL 证书时才接受 SSL 握手。这意味着，网关通过所需端口到 VPC 端点的出站流量免受由网络防火墙执行的检查。这些检查可能是 SSL 检查或深度数据包检查。

### 检查网关时间同步
<a name="w2ab1c40c15c11b9"></a>

时间偏差过大可能会导致 SSL 握手错误。对于本地网关，可以使用网关的本地 VM 控制台来检查网关的时间同步。时间偏差应不大于 60 秒。有关更多信息，请参阅 [Synchronizing Your Gateway VM Time](https://docs.aws.amazon.com/storagegateway/latest/vgw/MaintenanceTimeSync-hyperv.html)。

**系统时间管理**选项在托管于 Amazon EC2 实例上的网关中不可用。为确保 Amazon EC2 网关能够正确地同步时间，请确认 Amazon EC2 实例可以通过端口 UDP 和 TCP 123 连接到以下 NTP 服务器池列表：
+ 0.amazon.pool.ntp.org
+ 1.amazon.pool.ntp.org
+ 2.amazon.pool.ntp.org
+ 3.amazon.pool.ntp.org

### 检查 HTTP 代理并确认关联的安全组设置
<a name="w2ab1c40c15c11c11"></a>

在激活之前，请检查您是否在本地网关 VM 上将 Amazon EC2 上的 HTTP 代理配置为端口 3128 上的 Squid 代理。在此情况下，确认以下事项：
+ 连接到 Amazon EC2 上 HTTP 代理的安全组必须具有入站规则。此入站规则必须在端口 3128 上支持来自网关 VM 的 IP 地址的 Squid 代理流量。
+ 连接到 Amazon EC2 VPC 端点的安全组必须具有入站规则。这些入站规则必须在端口 1026-1028、1031、2222 和 443 上支持来自 Amazon EC2 上 HTTP 代理的 IP 地址的流量。

## 解决使用公有端点激活网关且同一 VPC 中有 Storage Gateway VPC 端点时出现的错误
<a name="w2ab1c40c15c13"></a>

要解决在同一 VPC 中有 Amazon Virtual Private Cloud（Amazon VPC）端点的情况下使用公有端点激活网关时出现的错误，请执行以下检查和配置。

### 确认 Storage Gateway VPC 端点上**启用私有 DNS 名称**设置未处于启用状态
<a name="w2ab1c40c15c13b5"></a>

如果**启用私有 DNS 名称**处于启用状态，则无法激活从该 VPC 到公有端点的任何网关。

**要禁用 DNS 名称选项，请执行以下操作：**

1. 打开 [Amazon VPC 控制台](https://console.aws.amazon.com//vpc/)。

1. 在导航窗格中，选择**端点**。

1. 选择 Storage Gateway VPC 端点。

1. 选择**操作**。

1. 选择**管理私有 DNS 名称**。

1. 对于**启用私有 DNS 名称**，清除**为此端点启用**。

1. 选择**修改私有 DNS 名称**来保存设置。

# 排查本地网关问题
<a name="troubleshooting-on-premises-gateway-issues"></a>

您可以在下面找到有关在使用本地网关时可能遇到的典型问题以及如何激活 支持 以帮助排除网关故障的信息。

下表列出了您在使用场内网关时可能遇到的典型问题。


| 问题 | 要采取的操作 | 
| --- | --- | 
| 您找不到网关的 IP 地址。  |  请使用管理程序客户端连接主机，以便查找网关 IP 地址。 [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/vgw/troubleshooting-on-premises-gateway-issues.html) 如果您仍然难以找到网关 IP 地址： [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/vgw/troubleshooting-on-premises-gateway-issues.html)  | 
| 您遇到了网络或防火墙问题。  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/vgw/troubleshooting-on-premises-gateway-issues.html)  | 
|  当您单击 Storage Gateway 管理控制台中的**继续激活**按钮时，网关的激活过程会失败。  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/vgw/troubleshooting-on-premises-gateway-issues.html)  | 
| 您需要移除分配为上传缓冲区空间的磁盘。例如，您可能希望减少网关的上传缓冲区空间大小，或者可能需要替换已发生故障的用作上传缓冲区的磁盘。  | 有关移除分配为上传缓冲区的磁盘的说明，请参阅[从网关中移除磁盘](add-remove-disks.md)  | 
|  您需要提高网关和 AWS之间的带宽。  |  您可以将互联网连接设置为 AWS 与连接应用程序和网关 VM 的网卡 (NIC) 分开的网络适配器 (NIC)，从而 AWS 改善从网关到的带宽。如果您有高带宽连接， AWS 并且想要避免带宽争用，尤其是在快照还原期间，则采用这种方法很有用。对于高吞吐量工作负载需求，您可以使用 [Direct Connect](https://aws.amazon.com/directconnect/) 在本地网关和 AWS间建立专用网络连接。要测量从您的网关到的连接带宽 AWS，请使用网关的`CloudBytesDownloaded`和`CloudBytesUploaded`指标。有关本主题的更多信息，请参阅 [衡量网关和网关之间的性能 AWS](PerfGatewayAWS-common.md)。提高 Internet 连接性能有助于确保您的上传缓冲区不被填满。  | 
|  往返您网关的吞吐量将为零。  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/vgw/troubleshooting-on-premises-gateway-issues.html) 您可以从 Amazon CloudWatch 控制台查看进出网关的吞吐量。有关测量进出网关的吞吐量的更多信息 AWS，请参阅[衡量网关和网关之间的性能 AWS](PerfGatewayAWS-common.md)。  | 
|  在 Microsoft Hyper-V 中导入（部署）Storage Gateway 时遇到问题。  |  请参阅 [排查 Microsoft Hyper-V 设置](troubleshooting-hyperv-setup.md)，其中对您在 Microsoft Hyper-V 上部署网关时遇到的部分常见问题进行了说明。  | 
|  您收到一条消息，指出“已写入网关卷中的数据未安全存储在 AWS中”。  |  如果您的网关虚拟机是从另一个网关虚拟机的克隆或快照创建的，则您会收到此消息。如果不是这种情况，请联系 支持。  | 

## 允许帮助 支持 对本地托管的网关进行故障排除
<a name="enable-support-access-on-premises"></a>

Storage Gateway 提供了一个本地控制台，您可以使用它来执行多项维护任务，包括激活 支持 以访问网关以帮助您解决网关问题。默认情况下，对您的网关的 支持 访问处于停用状态。您可通过主机的本地控制台来实现此访问。要 支持 访问您的网关，请先登录主机的本地控制台，导航到 Storage Gateway 的控制台，然后连接到支持服务器。

**允许 支持 访问您的网关**

1. 登录到主机的本地控制台。
   + VMware ESXi — 有关更多信息，请参阅[使用访问网关本地控制台 VMware ESXi](accessing-local-console.md#MaintenanceConsoleWindowVMware-common)。
   + Microsoft Hyper-V - 有关更多信息，请参阅[使用 Microsoft Hyper-V 访问网关本地控制台](accessing-local-console.md#MaintenanceConsoleWindowHyperV-common)。

1. 在提示符处输入相应的数字来选择**网关控制台**。

1. 输入 **h** 打开可用命令的列表。

1. 

   请执行以下操作之一：
   + 如果网关使用的是公有端点，请在**可用命令**窗口中，输入 **open-support-channel** 来连接到 Storage Gateway 的客户支持。允许 TCP 端口 22，以便您可以打开 AWS的支持通道。在连接到客户支持时，Storage Gateway 将为您分配支持编号。请记下您的支持编号。
   + 如果网关使用的是 VPC 端点，请在 **AVAILABLE COMMANDS** 窗口中，输入 **open-support-channel**。如果未激活网关，请提供要连接到 Storage Gateway 客户支持的 VPC 端点或 IP 地址。允许 TCP 端口 22，以便您可以打开 AWS的支持通道。在连接到客户支持时，Storage Gateway 将为您分配支持编号。请记下您的支持编号。
**注意**  
信道号不是（传输控制Protocol/User Datagram Protocol (TCP/UDP）端口号。相反，网关会与 Storage Gateway 服务器建立 Secure Shell (SSH) (TCP 22) 连接，并提供用于连接的支持通道。

1. 建立支持渠道后，请向提供您的支持服务号码， 支持 支持 以便提供故障排除帮助。

1. 在支持会话完成后，输入 **q** 以将其结束。在 Amazon Web Services Support 通知您支持会话完成之前，请勿关闭该会话。

1. 输入**exit**以注销网关控制台。

1. 按照提示操作退出本地控制台。

# 排查 Microsoft Hyper-V 设置
<a name="troubleshooting-hyperv-setup"></a>

下表列出了您在 Microsoft Hyper-V 平台上部署 Storage Gateway 时可能遇到的典型问题。


| 问题 | 要采取的操作 | 
| --- | --- | 
| 您尝试导入网关并收到以下错误消息： “尝试导入虚拟机时发生服务器错误。导入失败。在位置 […] 下找不到虚拟机导入文件。仅当使用 Hyper-V 创建和导出虚拟机时，才能导入虚拟机。”  |  出现此错误的原因如下： [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/storagegateway/latest/vgw/troubleshooting-hyperv-setup.html)  | 
|  您尝试导入网关并收到以下错误消息： “尝试导入虚拟机时发生服务器错误。导入失败。导入任务无法从 [...] 复制文件：文件存在。（0x80070050）”  |  如果您已经部署网关且试图重新使用存储了虚拟硬盘文件和虚拟机配置文件的默认文件夹，那么会出现此错误。要修复此问题，请在 **Hyper-V 设置**对话框左侧面板的**服务器**下方指定新位置。  | 
|  您尝试导入网关并收到以下错误消息： “尝试导入虚拟机时发生服务器错误。导入失败。Import failed because the virtual machine must have a new identifier。Select a new identifier and try the import again.”  |  导入网关时，请确保在**导入虚拟机**对话框中选择**复制虚拟机**选项并选中**复制所有文件**框，来为 VM 创建新的唯一 ID。  | 
|  您尝试启动网关 VM 并收到以下错误消息： “尝试启动选定的虚拟机时出错。子分区处理器设置与父分区不兼容。‘AWS-Storage-Gateway’无法初始化。（虚拟机 ID [...]）”  | 此错误可能是由于网关所需的 CPU 与主机 CPUs 上可用 CPUs 的 CPU 差异造成的。确保 VM 的 CPU 个数获得了底层管理程序的支持。 有关 Storage Gateway 要求的更多信息，请参阅[设置卷网关的要求](Requirements.md)。 | 
|  您尝试启动网关 VM 并收到以下错误消息： “尝试启动选定的虚拟机时出错。‘AWS-Storage-Gateway’无法初始化。（虚拟机 ID [...]）无法创建分区：系统资源不足，无法完成所请求的服务。（0x800705AA）”  |  此错误很可能是该网关所需的 RAM 和主机上可用的 RAM 之间的差异导致的。 有关 Storage Gateway 要求的更多信息，请参阅[设置卷网关的要求](Requirements.md)。  | 
|  您的快照和网关软件更新的出现时间会与预计的稍有不同。  |  网关 VM 的时钟可能会偏离实际的时间，这称为时钟漂移。使用本地网关控制台的时间同步选项，校验和纠正 VM 的时间。有关更多信息，请参阅 [将 VM 时间与 Hyper-V 或 Linux KVM 主机时间同步](MaintenanceTimeSync-hyperv.md)。  | 
|  您需要将解压缩的 Microsoft Hyper-V Storage Gateway 文件放入主机文件系统中。  |  按照访问典型 Microsoft Windows 服务器的方式访问主机。例如，如果虚拟机监控程序主机名为 `hyperv-server`，则可使用以下 UNC 路径 `\\hyperv-server\c$`，其中假定可解析名称 `hyperv-server`，或在本地 hosts 文件中定义了该名称。  | 
|  在连接管理程序时，系统会提示您输入证书。  |  以本地管理员的身份使用 Sconfig.cmd 工具给管理程序主机添加用户证书。  | 
|  如果对使用 Broadcom 网络适配器的 Hyper-V 主机开启虚拟机队列（VMQ），则可能会注意到网络性能不佳。  |  有关解决方法的信息，请参阅 Microsoft 文档：[Poor network performance on virtual machines on a Windows Server 2012 Hyper-V host if VMQ is turned on](https://learn.microsoft.com/en-us/troubleshoot/windows-server/networking/poor-network-performance-hyper-v-host-vm)。  | 

# 排查 Amazon EC2 网关问题
<a name="troubleshooting-EC2-gateway-issues"></a>

在以下部分中，您可以找到在使用部署到 Amazon EC2 的网关时可能遇到的典型问题。若要详细了解本地网关和 Amazon EC2 中部署的网关之间的区别，请参阅 [为卷网关部署自定义的 Amazon EC2 实例](ec2-gateway-common.md)。

**Topics**
+ [过了一会儿您的网关并未激活](#activation-issues)
+ [您在实例列表中找不到 EC2 网关实例](#find-instance)
+ [您创建了一个 Amazon EBS 卷，但无法将其附加到 EC2 网关实例](#ebs-volume-issue)
+ [您不能将启动程序挂载到 EC2 网关的卷目标](#initiator-issue)
+ [您在尝试添加存储卷时收到一条消息称“无可用磁盘”](#no-disk)
+ [您希望删除一个分配为上传缓冲区空间的磁盘来减少上传缓冲区空间](#uploadbuffer-issue)
+ [进出 EC2 网关的吞吐量降为零](#gateway-throughput-issue)
+ [您 支持 想帮忙排除 EC2 网关故障](#EC2-EnableAWSSupportAccess)
+ [您需要使用 Amazon EC2 Serial Console 连接到您的网关实例](#ec2-serial-console)

## 过了一会儿您的网关并未激活
<a name="activation-issues"></a>

在 Amazon EC2 控制台中检查以下项：
+ 已在与实例关联的安全组中激活端口 80。有关添加安全组规则的更多信息，请参阅《Amazon EC2 用户指南》**中的[添加安全组规则](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-security-groups.html#adding-security-group-rule)。
+ 网关实例会标记为“running”。在 Amazon EC2 控制台中，实例的**状态**应该是“正在运行”。
+ 确保您的 Amazon EC2 实例类型满足最低要求，如[存储需求](Requirements.md#requirements-storage)中所述。

纠正该问题后，请尝试重新激活网关。为此，请打开 Storage Gateway 控制台，选择**在 Amazon EC2 上部署新网关**，然后重新输入实例的 IP 地址。

## 您在实例列表中找不到 EC2 网关实例
<a name="find-instance"></a>

如果您没有为您的实例赋予资源标签，并且有很多实例在运行，则很难分辨哪个实例是您启动的。在这种情况下，可执行以下操作来查找网关实例：
+ 检查实例**说明**选项卡上的 Amazon 系统映像 (AMI) 名称。基于 Storage Gateway AMI 的实例应以 **aws-storage-gateway-ami** 文本开头。
+ 如果您有几个实例基于 Storage Gateway AMI，请查看实例启动时间来找到正确的实例。

## 您创建了一个 Amazon EBS 卷，但无法将其附加到 EC2 网关实例
<a name="ebs-volume-issue"></a>

检查讨论中的 Amazon EBS 卷是否与网关实例在同一可用区中。如果在不同的可用区，请在您的实例所在的可用区中创建一个新的 Amazon EBS 卷。

## 您不能将启动程序挂载到 EC2 网关的卷目标
<a name="initiator-issue"></a>

检查您启动实例时所使用的安全组是否包含允许您用于 iSCSI 访问的端口的规则。该端口通常设置为 3260。有关连接到卷的更多信息，请参阅[从 Windows 客户端连接到卷](ConfiguringiSCSIClient.md)。

## 您在尝试添加存储卷时收到一条消息称“无可用磁盘”
<a name="no-disk"></a>

没有为新激活的网关定义卷存储。在定义卷存储之前，必须将本地磁盘分配给网关，以便用作上传缓冲区和缓冲存储空间。对于部署到 Amazon EC2 的网关，本地磁盘是附加到实例的 Amazon EBS 卷。出现这个错误消息很可能是因为没有为实例定义 Amazon EBS 卷。

查看为运行网关的实例所定义的块储存设备。如果只存在两个数据块储存设备 (AMI 附带的默认设备)，那么应该增加存储。有关执行此操作的更多信息，请参阅 [为卷网关部署自定义的 Amazon EC2 实例](ec2-gateway-common.md)。在附加两个或两个以上的 Amazon EBS 卷后，尝试在网关上创建卷存储。

## 您希望删除一个分配为上传缓冲区空间的磁盘来减少上传缓冲区空间
<a name="uploadbuffer-issue"></a>

按照 [确定要分配的上传缓冲区的大小](decide-local-disks-and-sizes.md#CachedLocalDiskUploadBufferSizing-common) 中的步骤操作。

## 进出 EC2 网关的吞吐量降为零
<a name="gateway-throughput-issue"></a>

验证网关实例是否在运行。例如，如果实例因系统重启而处于启动过程中，请等待该实例完成重启。

另外，验证网关 IP 是否改变。如果实例已停止，然后重新启动，那么实例的 IP 地址可能会发生更改。在这种情况下，您必须激活新的网关。

您可以从 Amazon CloudWatch 控制台查看进出网关的吞吐量。有关测量进出网关的吞吐量的更多信息 AWS，请参阅[衡量网关和网关之间的性能 AWS](PerfGatewayAWS-common.md)。

## 您 支持 想帮忙排除 EC2 网关故障
<a name="EC2-EnableAWSSupportAccess"></a>

Storage Gateway 提供了一个本地控制台，您可以使用它 支持 来执行多项维护任务，包括激活访问网关以帮助您解决网关问题。默认情况下，对您的网关的 支持 访问处于停用状态。通过 Amazon EC2 本地控制台来提供此访问。通过 Secure Shell (SSH) 登录到 Amazon EC2 本地控制台。要通过 SSH 成功登录，您的实例的安全组必须具有开放 TCP 端口 22 的规则。

**注意**  
如果将新规则添加到现有安全组，则新规则适用于使用该安全组的所有实例。有关安全组以及如何添加安全组规则的更多信息，请参阅**《Amazon EC2 用户指南》中的 [Amazon EC2 安全组](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-network-security.html)。

要 支持 连接您的网关，您需要先登录 Amazon EC2 实例的本地控制台，导航到存储网关的控制台，然后提供访问权限。

**激活对部署在 Amazon EC2 实例上的网关的 支持 访问权限**

1. 登录到 Amazon EC2 实例的本地控制台。有关说明，请转到**《Amazon EC2 用户指南》中的[连接到您的实例](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/AccessingInstances.html)。

   您可使用以下命令登录到 EC2 实例的本地控制台。

   ```
   ssh –i PRIVATE-KEY admin@INSTANCE-PUBLIC-DNS-NAME
   ```
**注意**  
*PRIVATE-KEY*是包含您用于启动 Amazon EC2 实例的 EC2 密钥对的私有证书的`.pem`文件。有关更多信息，请参阅**《Amazon EC2 用户指南》中的[检索密钥对的公有密钥](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-key-pairs.html#retriving-the-public-key)。  
*INSTANCE-PUBLIC-DNS-NAME*是运行网关的 Amazon EC2 实例的公有域名系统 (DNS) 名称。可通过在 EC2 控制台中选择 Amazon EC2 实例并单击**说明**选项卡来获取此公有 DNS 名称。

1. 在提示符处，输入 **6 - Command Prompt** 来打开 支持 通道控制台。

1. 输入 **h** 以打开 **AVAILABLE COMMANDS** 窗口。

1. 请执行以下操作之一：
   + 如果网关使用的是公有端点，请在**可用命令**窗口中，输入 **open-support-channel** 来连接到 Storage Gateway 的客户支持。允许 TCP 端口 22，以便您可以打开 AWS的支持通道。在连接到客户支持时，Storage Gateway 将为您分配支持编号。请记下您的支持编号。
   + 如果网关使用的是 VPC 端点，请在 **AVAILABLE COMMANDS** 窗口中，输入 **open-support-channel**。如果未激活网关，请提供要连接到 Storage Gateway 客户支持的 VPC 端点或 IP 地址。允许 TCP 端口 22，以便您可以打开 AWS的支持通道。在连接到客户支持时，Storage Gateway 将为您分配支持编号。请记下您的支持编号。
**注意**  
信道号不是（传输控制Protocol/User Datagram Protocol (TCP/UDP）端口号。相反，网关会与 Storage Gateway 服务器建立 Secure Shell (SSH) (TCP 22) 连接，并提供用于连接的支持通道。

1. 建立支持渠道后，请向提供您的支持服务号码， 支持 支持 以便提供故障排除帮助。

1. 在支持会话完成后，输入 **q** 以将其结束。在 支持 通知您支持会话已完成之前，请勿关闭会话。

1. 输入 **exit** 来退出 Storage Gateway 控制台。

1. 通过控制台菜单操作来注销 Storage Gateway 实例。

## 您需要使用 Amazon EC2 Serial Console 连接到您的网关实例
<a name="ec2-serial-console"></a>

您可以使用 Amazon EC2 Serial Console 来排查引导、网络配置和其他问题。有关说明和故障排除提示，请参阅《Amazon Elastic Compute Cloud 用户指南》**中的 [Amazon EC2 Serial Console](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-serial-console.html)。

# 排查硬件设备问题
<a name="troubleshooting-hardware-appliance-issues"></a>

以下主题介绍了您可能遇到的 Storage Gateway 硬件设备问题以及排查这些问题的建议。

## 您无法确定服务 IP 地址
<a name="service_ip_address"></a>

当尝试连接到您的服务时，请确保您使用的是该服务的 IP 地址，而不是主机的 IP 地址。在服务控制台中配置服务 IP 地址，并在硬件控制台中配置主机 IP 地址。您将在启动硬件设备时看到硬件控制台。要从硬件控制台转到服务控制台，请选择 **Open Service Console (打开服务控制台)**。

## 如何执行出厂重置？
<a name="factory_reset"></a>

如果您需要在设备上执行出厂重置，请联系 Storage Gateway 硬件设备团队来获得支持，如后面的“支持”部分中所述。

## 如何执行远程重启？
<a name="remote-restart"></a>

如果您需要远程重启设备，可以使用 Dell iDRAC 管理界面执行此操作。有关更多信息，请参阅 Dell Technologies InfoHub 网站上的 [i DRAC9 虚拟电源循环：远程重启 Dell EMC PowerEdge 服务器](https://infohub.delltechnologies.com/en-us/p/idrac9-virtual-power-cycle-remotely-power-cycle-dell-emc-poweredge-servers/)。

## 您在何处获得 Dell iDRAC 支持？
<a name="iDRAC_support"></a>

戴尔 PowerEdge 服务器配有戴尔iDRAC管理接口。我们建议执行下列操作：
+ 如果您使用 iDRAC 管理界面，则应更改默认密码。有关iDRAC凭证的更多信息，[请参阅 PowerEdge 戴尔——iDRAC的默认登录凭据是什么？](https://www.dell.com/support/article/en-us/sln306783/dell-poweredge-what-is-the-default-username-and-password-for-idrac?lang=en) 。
+ 确保固件是 up-to-date为了防止安全漏洞。
+ 将 iDRAC 网络接口移动到正常的 (`em`) 端口可能会导致性能问题或阻止设备正常运行。

## 您找不到硬件设备序列号
<a name="appliance_serial_number"></a>

可以使用 Storage Gateway 控制台查找 Storage Gateway 硬件设备的序列号。

**查找硬件设备序列号：**

1. 在[https://console.aws.amazon.com/storagegateway/家](https://console.aws.amazon.com/storagegateway/)中打开 Storage Gateway 控制台。

1. 从页面左侧的导航菜单中选择**硬件**。

1. 从列表中选择硬件设备。

1. 在设备的**详细信息**选项卡上找到**序列号**字段。

## 在何处获得硬件设备支持
<a name="appliance_support"></a>

 AWS 要联系您的硬件设备的技术支持，请参阅[支持](https://aws.amazon.com/contact-us)。

该 支持 团队可能会要求您激活支持渠道，以远程解决您的网关问题。您无需打开此端口即可实现网关的正常操作，但在进行问题排查时需要打开。您可以从硬件控制台激活支持通道，如下面的过程所示。

**要打开支持渠道 AWS**

1. 打开硬件控制台。

1. 选择硬件控制台主页底部的**打开支持渠道**，然后按 `Enter`。

   如果没有网络连接或防火墙问题，分配的端口号应该在 30 秒内出现。例如：

   **状态：在端口 19599 上打开**

1. 记下端口号并将其提供给 支持。

# 排查卷问题
<a name="troubleshoot-volume-issues"></a>

您可以找到有关您使用卷时可能遇到的最典型问题以及为解决这些问题我们建议您采取的措施的信息。

**Topics**
+ [控制台显示您的卷未配置](#troubleshoot-volume-issues.VolumeNotConfigured)
+ [控制台显示您的卷无法恢复](#troubleshoot-volume-issues.VolumeIrrecoverable)
+ [您的缓存网关无法访问，您希望恢复数据](#RecoverySnapshotTroubleshooting)
+ [控制台显示您的卷处于 PASS THROUGH 状态](#troubleshoot-volume-issues.VolumePassthrough)
+ [您要验证卷的完整性并修复可能的错误](#troubleshoot-volume-issues.VerifyIntegrity)
+ [您的卷的 iSCSI 目标未在 Windows 磁盘管理控制台中显示](#troubleshoot-volume-issues.DoesNotAppear)
+ [您要更改卷的 iSCSI 目标名称](#troubleshoot-volume-issues.ChangeISCSI)
+ [您计划的卷快照未创建](#troubleshoot-volume-issues.NoSnapshot)
+ [您需要移除或更换出现故障的磁盘](#troubleshoot-volume-issues.RemoveVolume)
+ [从应用程序到卷的吞吐量降为零](#troubleshoot-volume-issues.ThroughputZero)
+ [您网关中的一个缓存磁盘遇到了故障](#troubleshoot-volume-issues.CacheDiskFail)
+ [卷快照处于 PENDING 状态的时间长于预期时间](#SnapshotTroubleshooting.Pending)
+ [高可用性运行状况通知](#troubleshooting-ha-notifications)

## 控制台显示您的卷未配置
<a name="troubleshoot-volume-issues.VolumeNotConfigured"></a>

如果 Storage Gateway 控制台显示您的卷处于“未配置上传缓冲区”状态，请为您的网关添加上传缓冲区容量。如果网关的上传缓冲区尚未配置，您就不能用网关存储应用程序数据。有关更多信息，请参阅 [为网关配置额外的上传缓冲区或缓存存储](ConfiguringLocalDiskStorage.md#GatewayWorkingStorageCachedTaskBuffer)。

## 控制台显示您的卷无法恢复
<a name="troubleshoot-volume-issues.VolumeIrrecoverable"></a>

对于存储卷，如果 Storage Gateway 控制台显示您的卷处于“无法恢复”状态，则您无法再使用此卷。您可以尝试在 Storage Gateway 控制台中删除该卷。如果该卷上有数据，您可以在创建新卷时根据最初用来创建该卷的 VM 本地磁盘恢复这些数据。在创建新卷时，请选择 **Preserve existing data**。移除卷前，请确保删除卷的待创建快照。有关更多信息，请参阅 [删除存储卷的快照](DeletingASnapshot.md)。如果在 Storage Gateway 控制台中删除该卷不起作用，那么为该卷分配的磁盘可能已错误地从 VM 中移除，并且无法从设备中移除。

对于缓存卷，如果 Storage Gateway 控制台显示您的卷处于“无法恢复”状态，则您无法再使用此卷。如果卷上有数据，您可以创建卷的快照，然后从快照恢复数据，也可以从上一个恢复点克隆卷。您可以在恢复数据后删除卷。有关更多信息，请参阅 [您的缓存网关无法访问，您希望恢复数据](#RecoverySnapshotTroubleshooting)。

对于存储卷，您可以从曾用于创建无法恢复的卷的磁盘创建新卷。有关更多信息，请参阅 [创建存储卷](GettingStartedCreateVolumes.md)。有关卷状态的信息，请参阅[了解卷状态和转换](StorageVolumeStatuses.md)。

## 您的缓存网关无法访问，您希望恢复数据
<a name="RecoverySnapshotTroubleshooting"></a>

当您的网关变得无法访问时 (例如，在您关闭网关时)，您可以选择从卷恢复点创建快照并使用该快照，也可以选择从现有卷的上一个恢复点克隆新卷。与创建快照相比，从卷恢复点进行克隆将更快且更经济高效。有关克隆卷的更多信息，请参阅[从恢复点克隆缓存卷](clone-volume.md)。

Storage Gateway 在缓存卷网关架构中提供各个卷的恢复点。*卷的恢复点* 是一个时间点，该卷在此时间点的所有数据均一致，并且您可以从该点创建快照或克隆卷。

## 控制台显示您的卷处于 PASS THROUGH 状态
<a name="troubleshoot-volume-issues.VolumePassthrough"></a>

在某些情况下，Storage Gateway 控制台可能会显示您的卷处于“传递”状态。卷可能会因若干原因处于 PASSTHROUGH 状态。对某些原因需要采取措施，而对另一些则不需要。

例如，当网关用完了上传缓冲区空间时，如果您的卷处于 PASS THROUGH 状态，则应该采取措施。要验证过去是否超过了上传缓冲区，您可以在 Amazon CloudWatch 控制台中查看该`UploadBufferPercentUsed`指标；有关更多信息，请参阅[监控上传缓冲区](PerfUploadBuffer-common.md)。如果您的网关由于上传缓冲区空间用完而处于“传递”状态，则应为网关分配更多的上传缓冲区空间。添加更多缓冲区空间会自动使您的卷从“传递”转换为“正在引导”，然后再转换为“可用”。当卷处于“正在引导”状态时，网关从卷的磁盘中读取数据，将这些数据上传到 Amazon S3，然后根据需要补充数据。当网关补充完数据并将卷数据保存到 Amazon S3 后，卷状态即变为“可用”，并且可再次启动快照。请注意，当卷处于 PASS THROUGH 或 BOOTSTRAPPING 状态时，您可以继续在卷磁盘中读取和写入数据。有关添加更多上传缓冲区空间的更多信息，请参阅 [确定要分配的上传缓冲区的大小](decide-local-disks-and-sizes.md#CachedLocalDiskUploadBufferSizing-common)。

如需在超出上传缓冲区空间前采取行动，您可以对网关的上传缓冲区设置阈值警报。有关更多信息，请参阅 [如需为网关的上传缓冲区设置上阈值警报](PerfUploadBuffer-common.md#GatewayAlarm1-common)。

相反，在卷处于 PASS THROUGH 状态时无需采取措施的一个示例是：该卷因为另一个卷当前正在引导中而排队等待引导。网关在同一时间自举一个卷。

PASS THROUGH 状态偶尔可能表示分配为上传缓冲区的磁盘已失效。在此情况下，您应该移除磁盘。有关更多信息，请参阅 [使用卷网关存储资源](resource-volume-gateway.md)。有关卷状态的信息，请参阅[了解卷状态和转换](StorageVolumeStatuses.md)。

## 您要验证卷的完整性并修复可能的错误
<a name="troubleshoot-volume-issues.VerifyIntegrity"></a>

如果您要验证卷的完整性并修复可能的错误，且您的网关使用 Microsoft Windows 启动程序连接到其卷，则可以使用 Windows CHKDSK 实用工具来验证卷的完整性并修复卷上的任何错误。Windows 在检测到卷损坏时会自动运行 CHKDSK 工具，您也可以自行运行。

## 您的卷的 iSCSI 目标未在 Windows 磁盘管理控制台中显示
<a name="troubleshoot-volume-issues.DoesNotAppear"></a>

如果您的卷的 iSCSI 目标未在 Windows 的磁盘管理控制台中显示，请检查您是否为网关配置了上传缓冲区。有关更多信息，请参阅 [为网关配置额外的上传缓冲区或缓存存储](ConfiguringLocalDiskStorage.md#GatewayWorkingStorageCachedTaskBuffer)。

## 您要更改卷的 iSCSI 目标名称
<a name="troubleshoot-volume-issues.ChangeISCSI"></a>

如果您要更改卷的 iSCSI 目标名称，则必须移除该卷并使用新的目标名称重新添加该卷。如果这样做，您可以将数据保存在卷上。

## 您计划的卷快照未创建
<a name="troubleshoot-volume-issues.NoSnapshot"></a>

如果您计划的卷快照未能创建，请检查您的卷是否处于 PASSTHROUGH 状态，或者网关的上传缓冲区是否在计划的快照时间之前被填满。您可以在 Amazon CloudWatch 控制台中查看网关的`UploadBufferPercentUsed`指标，并为该指标创建警报。有关更多信息，请参阅[监控上传缓冲区](PerfUploadBuffer-common.md)和[如需为网关的上传缓冲区设置上阈值警报](PerfUploadBuffer-common.md#GatewayAlarm1-common)。

## 您需要移除或更换出现故障的磁盘
<a name="troubleshoot-volume-issues.RemoveVolume"></a>

如果您需要更换出现故障的卷磁盘或更换不再需要的卷，则应先使用 Storage Gateway 控制台移除该卷。有关更多信息，请参阅 [删除卷](ApplicationStorageVolumesCached-Removing.md#CachedRemovingAStorageVolume)。然后使用管理程序客户端移除备份存储：

 
+ 对于 VMware ESXi，请按中所述移除后备存储空间[删除存储卷](ApplicationStorageVolumesCached-Removing.md)。
+ 对于 Microsoft Hyper-V，请删除支持存储。

## 从应用程序到卷的吞吐量降为零
<a name="troubleshoot-volume-issues.ThroughputZero"></a>

如果从应用程序到卷的吞吐量降为零，请尝试以下操作：
+ **如果您使用的是 VMware vSphere 客户端，请检查您的卷**的主机 IP** 地址是否与 vSphere 客户端的 “摘要” 选项卡上显示的地址之一相匹配。**您可以在 Storage Gateway 控制台中存储卷的**详细信息**选项卡中找到该卷的**主机 IP** 地址。举例而言，在您向网关分配新的静态 IP 地址的情况下，可能会发生 IP 地址的不一致情况。如果出现不一致，请从 Storage Gateway 控制台重启您的网关，如[关闭网关虚拟机](MaintenanceShutDown-common.md)中所述。重启后，存储卷的 **ISCSI 目标信息**选项卡中的**主机 IP** 地址应与网关的**摘要**选项卡上的 vSphere 客户端中显示的 IP 地址相匹配。
+ 如果 **Host IP** 框中没有该卷的 IP 地址，网关处于联机状态。例如，当您创建的卷与配有两个或两个以上网络适配器的网关中某个网络适配器的 IP 地址关联时，就会出现此情况。当您移除或停用与该卷关联的网络适配器时，**主机 IP** 框中可能不会显示 IP 地址。要解决这一问题，请在保存现有数据的同时移除卷然后重新创建。
+ 检查您的应用程序使用的 iSCSI 启动程序是否正确映射到存储卷的 iSCSI 目标。有关连接到存储卷的更多信息，请参阅 [从 Windows 客户端连接到卷](ConfiguringiSCSIClient.md)。

您可以从 Amazon CloudWatch 控制台查看卷的吞吐量并创建警报。有关测量应用程序到卷的吞吐量的更多信息，请参阅[衡量您的应用程序和网关间的性能。](PerfAppGateway-common.md)。

## 您网关中的一个缓存磁盘遇到了故障
<a name="troubleshoot-volume-issues.CacheDiskFail"></a>

如果网关中的一个或多个缓存磁盘出现故障，则该网关会阻止对虚拟磁带执行读写操作。要恢复正常功能，请按如下所述重新配置网关：
+ 如果缓存磁盘无法访问或不可用，请从网关配置中删除该磁盘。
+ 如果缓存磁盘仍然可以访问和使用，请将其重新连接到您的网关。

**注意**  
如果删除缓存磁盘，则当网关恢复正常功能时，拥有干净数据的磁带或卷（即其缓存磁盘中的数据和 Amazon S3 中的数据已同步）将继续可用。例如，如果您的网关有三个缓存磁盘，而您删除了两个缓存磁盘，则干净的磁带或卷将处于“可用”状态。其他磁带和卷将处于“不可恢复”状态。  
如果您使用临时磁盘作为网关的缓存磁盘或将缓存磁盘装载到临时驱动器，则关闭网关时缓存磁盘将丢失。在缓存磁盘和 Amazon S3 未同步时关闭网关会导致数据丢失。因此，我们不建议使用临时驱动器或磁盘。

## 卷快照处于 PENDING 状态的时间长于预期时间
<a name="SnapshotTroubleshooting.Pending"></a>

如果卷快照保持 PENDING 状态的时间长于预期时间，则网关 VM 可能已意外崩溃，或卷的状态可能已更改为 PASS THROUGH 或 IRRECOVERABLE。如果是以上任一情况，则快照将保持 PENDING 状态且快照不会成功完成。如果出现这些情况，建议您删除快照。有关更多信息，请参阅 [删除存储卷的快照](DeletingASnapshot.md)。

当卷恢复 AVAILABLE 状态时，请为卷创建新快照。有关卷状态的信息，请参阅[了解卷状态和转换](StorageVolumeStatuses.md)。

## 高可用性运行状况通知
<a name="troubleshooting-ha-notifications"></a>

在 VMware vSphere 高可用性 (HA) 平台上运行网关时，您可能会收到运行状况通知。有关运行状况通知的更多信息，请参阅[排查高可用性问题](troubleshooting-ha-issues.md)。

# 排查高可用性问题
<a name="troubleshooting-ha-issues"></a>

如果您遇到可用性问题，则可在下面查找有关要采取的操作的信息。

**Topics**
+ [运行状况通知](#ha-health-notifications)
+ [指标](#ha-health-notification-metrics)

## 运行状况通知
<a name="ha-health-notifications"></a>

当您在 VMware vSphere HA 上运行网关时，所有网关都会向您配置的 Amazon CloudWatch 日志组生成以下运行状况通知。这些通知将转至名为 `AvailabilityMonitor` 的日志流中。

**Topics**
+ [通知：重启](#troubleshoot-reboot-notification)
+ [通知： HardReboot](#troubleshoot-hardreboot-notification)
+ [通知： HealthCheckFailure](#troubleshoot-healthcheckfailure-notification)
+ [通知： AvailabilityMonitorTest](#troubleshoot-availabilitymonitortest-notification)

### 通知：重启
<a name="troubleshoot-reboot-notification"></a>

在重新启动网关 VM 时，您会收到重启通知。您可以使用 VM 管理程序管理控制台或 Storage Gateway 控制台重新启动网关 VM。您也可以在网关维护周期内使用网关软件来重新启动。

**措施**

如果重启时间在网关的已配置[维护开始时间](MaintenanceManagingUpdate-common.md)的 10 分钟内，则此情况可能是正常的，并不指示任何问题。如果重启发生在维护时段之外，请检查是否已手动重新启动网关。

### 通知： HardReboot
<a name="troubleshoot-hardreboot-notification"></a>

当网关 VM 意外重启时，您会收到 `HardReboot` 通知。此类重启可能是因断电、硬件故障或其他事件导致的。对于 VMware 网关，vSphere 高可用性应用程序监控的重置可以启动此事件。

**措施**

当您的网关在这样的环境中运行时，请检查`HealthCheckFailure`通知是否存在，并查阅虚拟机 VMware 的事件日志。

### 通知： HealthCheckFailure
<a name="troubleshoot-healthcheckfailure-notification"></a>

对于 VMware vSphere HA 上的网关，当运行状况检查失败并请求重启虚拟机时，您可以收到`HealthCheckFailure`通知。此事件也会在测试期间发生来监控可用性（由 `AvailabilityMonitorTest` 通知指示）。在此情况下，应会有 `HealthCheckFailure` 通知。

**注意**  
此通知仅适用于 VMware 网关。

**措施**

如果此事件重复发生，但没有 `AvailabilityMonitorTest` 通知，请检查您的 VM 基础设施是否存在问题（存储、内存等）。如果您需要其他帮助，请联系 支持。

### 通知： AvailabilityMonitorTest
<a name="troubleshoot-availabilitymonitortest-notification"></a>

对于 VMware vSphere HA 上的网关，当您在中[运行[可用性和应用程序监控](https://docs.aws.amazon.com/storagegateway/latest/APIReference/API_StartAvailabilityMonitorTest.html)系统测试](vmware-ha.md#vmware-ha-test-failover)时，您会`AvailabilityMonitorTest`收到通知。 VMware

## 指标
<a name="ha-health-notification-metrics"></a>

`AvailabilityNotifications` 指标适用于所有网关。此指标是网关生成的与可用性相关的运行状况通知数。使用 `Sum` 统计数据可观察网关是否遇到了任何与可用性相关的事件。有关事件的详细信息，请咨询您配置的 CloudWatch 日志组。