

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 设置 Amazon Managed Grafana 工作区
<a name="sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws"></a>

使用 Amazon Managed Service for Prometheus 作为数据来源，创建新的 Amazon Managed Grafana 作业区或更新现有的 Amazon Managed Grafana 作业区。

**Topics**
+ [创建 Grafana 作业区并将 Amazon Managed Service for Prometheus 设置为数据来源](#sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-create)
+ [打开 Grafana 作业区并完成数据来源设置](#sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-connect-data-source)
+ [导入开源 Grafana 控制面板](#sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-import-dashboards)

## 创建 Grafana 作业区并将 Amazon Managed Service for Prometheus 设置为数据来源
<a name="sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-create"></a>

要可视化 Amazon Managed Service for Prometheus 的指标，请创建 Amazon Managed Grafana 作业区并将其设置为使用 Amazon Managed Service for Prometheus 作为数据来源。

1. 要创建 Grafana 作业区，请按照 [Amazon Managed Service for Prometheus User Guide](https://docs.aws.amazon.com/grafana/latest/userguide/AMG-create-workspace.html#creating-workspace) 中的*创建空间*进行操作。

   1. 在步骤 13 中，选择 Amazon Managed Service for Prometheus 作为数据来源。

   1. 在步骤 17 中，您可以在 IAM Identity Center 中添加管理员用户和其他用户。

要了解更多信息，请参阅以下资源。
+ 在[《Amazon Managed Service for Prometheus 用户指南》](https://docs.aws.amazon.com/prometheus/latest/userguide/AMP-amg.html)中*设置 Amazon Managed Grafana，以便与 Amazon Managed Service for Prometheus 配合使用*。
+ [https://docs.aws.amazon.com/grafana/latest/userguide/AMP-adding-AWS-config.html](https://docs.aws.amazon.com/grafana/latest/userguide/AMP-adding-AWS-config.html)

## 打开 Grafana 作业区并完成数据来源设置
<a name="sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-connect-data-source"></a>

成功创建或更新 Amazon Managed Grafana 作业区后，选择作业区 URL 以打开作业区。系统会提示您输入在 IAM Identity Center 中设置的用户名和密码。您应该使用管理员用户登录，以完成作业区的设置。

1. 在作业区**主页**页面，选择**应用程序**、**AWS 数据来源**和**数据来源**。

1. 在**数据来源**页面，选择**数据来源**选项卡。

1. 在**服务**中，选择 Amazon Managed Service for Prometheus。

1. 在**浏览和配置数据源**部分，选择您为 Prometheus 工作空间配置亚马逊托管服务的 AWS 区域。

1. 从所选区域的数据来源列表中，选择 Amazon Managed Service for Prometheus 的数据来源。请务必检查您为可观察性堆栈设置的适用于 Prometheus 的亚马逊托管服务工作空间的资源 ID 和资源别名。 HyperPod 

## 导入开源 Grafana 控制面板
<a name="sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-import-dashboards"></a>

成功设置 Amazon Managed Grafana 作业区并将 Amazon Managed Service for Prometheus 作为数据来源后，您就可以开始向 Prometheus 收集指标，然后就可以看到显示图表、信息等的各种控制面板。Grafana 开源软件提供各种控制面板，您可以将它们导入 Amazon Managed Grafana。

**将开源 Grafana 控制面板导入 Amazon Managed Grafana**

1. 在 Amazon Managed Grafana 作业区的**主页**页面中，选择**控制面板**。

1. 选择带有用户界面文本**新建**的下拉菜单按钮，然后选择**导入**。

1. 将 URL 粘贴到 [Slurm 控制面板](https://grafana.com/grafana/dashboards/4323-slurm-dashboard/)。

   ```
   https://grafana.com/grafana/dashboards/4323-slurm-dashboard/
   ```

1. 选择**加载**。

1. 重复前面的步骤导入以下控制面板。

   1. [Node Exporter Full Dashboard](https://grafana.com/grafana/dashboards/1860-node-exporter-full/)

      ```
      https://grafana.com/grafana/dashboards/1860-node-exporter-full/
      ```

   1. [NVIDIA DCGM 导出器控制面板](https://grafana.com/grafana/dashboards/12239-nvidia-dcgm-exporter-dashboard/)

      ```
      https://grafana.com/grafana/dashboards/12239-nvidia-dcgm-exporter-dashboard/
      ```

   1. [EFA 指标控制面板](https://grafana.com/grafana/dashboards/20579-efa-metrics-dev/)

      ```
      https://grafana.com/grafana/dashboards/20579-efa-metrics-dev/
      ```

   1. [FSx 适用于 Lustre 指标控制面板](https://grafana.com/grafana/dashboards/20906-fsx-lustre/)

      ```
      https://grafana.com/grafana/dashboards/20906-fsx-lustre/
      ```