本指南提供了 Wickr Enterprise 的文档。如果您使用的是 AWS Wickr，请参阅 [AWS Wickr 管理指南](https://docs.aws.amazon.com/wickr/latest/adminguide/what-is-wickr.html)或 AW [S Wickr 用户](https://docs.aws.amazon.com/wickr/latest/userguide/what-is-wickr.html)指南。

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Wickr 嵌入式集群安装故障排除
<a name="troubleshooting-installation"></a>

这些故障排除步骤的所有实例都假设您对运行 Wickr Embedded Cluster 安装的实例拥有 shell 访问权限，并且已运行`./wickr-enterprise-ha shell`命令以便能够直接与 Kubernetes 安装进行交互。

## 一般性问题
<a name="general-issues"></a>

**集群管理屏幕中缺少 “添加节点” 按钮**

***Airgapped 安装***

如果您正在安装 airgap，请联系 Wickr Support 寻求帮助，以纠正此行为。

***标准安装***

如果您的许可证包括嵌入式集群多节点授权，请执行许可证同步以获取最新版本。如果您不确定或没有此权利，请联系 Wickr Support。

要执行许可证同步，请完成以下步骤。

1. 导航到 KOTS 控制面板。

1. 在 “**控制面板**” 页面上，找到页面右上角区域的许可证部分。

1. 在本部分的右上角，您应该会看到**同步许可证**超链接。选择超链接。

1. 许可证同步后，会显示用户界面更新和**几秒钟前的最后一次同步**。

1. 从 KOTS 控制面板页面**的 “版本**” 部分选择 “**重新部署**”。

1. 重新部署完成后，导航回**集群管理**，即可添加节点。

## 升级问题
<a name="upgrade-issues"></a>

**升级集群时升级停滞不前**

如果你的升级在**升级集群**时停滞不前，这可能意味着某些 pod 没有被适当地终止。登录实例并使用`./wickr-enteprise-ha shell`命令进入用于管理 kubernetes 安装的 shell 环境。

1. 识别仍在运行的 pod：

   `kubectl -n kotsadm get pods | grep Running`

1. `kubectl -n kotsadm delete pod {{name-of-running-pod}}`
**注意**  
如果其中一个正在运行的 pod 是`embedded-cluster-upgrade-XXXXXXXXXXXXXX-xxxxx``kotsadm-xxxxxxx`或类似的，请不要将其删除，因为这些 Pod 是执行升级所必需的。

1. 确认没有剩余的正在运行的 pod。

   `kubectl -n kotsadm get pods | grep Running`

此过程应允许通过 Wickr 升级继续进行集群升级。

**集群升级期间应用程序未更新且无法部署新版本**

如果应用程序在升级后仍使用旧版本，则新版本可能处于不一致的状态。

查看 Kubernetes 的安装记录：

1. 从安装程序中打开 Kubernetes 外壳。

   `./wickr-enterprise-ha shell`

1. 运行以下 kubectl 命令：

   `kubectl get installations`

1. 输出将如下所示：

   ```
         [root@ip-172-31-6-72 ~]# kubectl get installations
   NAME             STATE      INSTALLERVERSION   CREATEDAT              AGE
   20251113170603   Obsolete   2.1.3+k8s-1.30     2025-11-13T17:06:05Z   22h
   20251113180133   Failed     2.6.0+k8s-1.31     2025-11-13T18:01:37Z   21h
   ```

1. 删除失败的安装。

   `kubectl delete installation 20251113180133`

1. 尝试通过 KOTS 管理面板再次运行升级。

**RabbitMQ Pod 因日志行而失败 `Error while waiting for Mnesia tables: {timeout_waiting_for_tables}`**

RabbitMQ 密钥和存储空间不同步。当多个 RabbitMQ 实例运行并导致领导者选择或法定人数错误时，通常会发生这种情况。要修复此问题，请删除 RabbitMQ 服务及其存储卷，然后重新部署。

要删除失败的 RabbitMQ，请完成以下步骤。

1. 删除 RabbitMQ Statefulset。

   `kubectl -n kotsadm delete statefulset rabbitmq —cascade=orphan`

1. 删除剩余的 RabbitMQ 吊舱。如果有多个 RabbitMQ-X 容器在运行，请多次发出此命令，更新 RabbitMQ-X 值以使其与其他 pod 名称相对应。

   `kubectl -n kotsadm delete pod rabbitmq-0`

1. 删除相应的 PVCs。如果有多个 pod 在运行，请多次发出此命令，更新 data-RabbitMQ-X以对应相应的 pod。

   `kubectl -n kotsadm delete pvc data-rabbitmq-0`

1. 检查是否还有剩余的 pod，如果成功则不会输出任何内容。

   `kubectl -n kotsadm get pods|grep -i rabbitmq`

1. 检查是否还有剩余内容 PVCs，如果成功则不会输出任何内容。

   `kubectl -n kotsadm get pvc|grep -i rabbitmq`

1. 通过 KOTS 管理面板重新部署。

有关故障排除的更多信息，请参阅[故障排除](https://docs.aws.amazon.com/wickr/latest/wickrenterpriseinstall/troubleshooting.html)。