

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 設定 Amazon Managed Grafana 工作區
<a name="sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws"></a>

建立新的 Amazon Managed Grafana 工作區，或使用 Amazon Managed Service for Prometheus 做為資料來源更新現有的 Amazon Managed Grafana 工作區。

**Topics**
+ [建立 Grafana 工作區並將 Amazon Managed Service for Prometheus 設定為資料來源](#sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-create)
+ [開啟 Grafana 工作區並完成資料來源的設定](#sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-connect-data-source)
+ [匯入開放原始碼 Grafana 儀表板](#sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-import-dashboards)

## 建立 Grafana 工作區並將 Amazon Managed Service for Prometheus 設定為資料來源
<a name="sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-create"></a>

若要從 Amazon Managed Service for Prometheus 視覺化指標，請建立 Amazon Managed Grafana 工作區，並將其設定為使用 Amazon Managed Service for Prometheus 作為資料來源。

1. 若要建立 Grafana 工作區，請遵循《Amazon Managed Service for Prometheus 使用者指南》**中的[建立工作區](https://docs.aws.amazon.com/grafana/latest/userguide/AMG-create-workspace.html#creating-workspace)中的指示。

   1. 在步驟 13 中，選取 Amazon Managed Service for Prometheus 作為資料來源。

   1. 在步驟 17 中，您可以在 IAM Identity Center 中新增管理員使用者以及其他使用者。

如需詳細資訊，另請參閱下列資源。
+ 《Amazon Managed Service for Prometheus 使用者指南》**中的[設定 Amazon Managed Grafana 以與 Amazon Managed Service for Prometheus 搭配使用](https://docs.aws.amazon.com/prometheus/latest/userguide/AMP-amg.html)
+ 《[Amazon Managed Grafana 使用者指南》中的使用 AWS 資料來源組態將 Amazon Managed Service for Prometheus 新增為資料來源](https://docs.aws.amazon.com/grafana/latest/userguide/AMP-adding-AWS-config.html) **

## 開啟 Grafana 工作區並完成資料來源的設定
<a name="sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-connect-data-source"></a>

在您成功建立或更新了 Amazon Managed Grafana 工作區之後，請選取工作區 URL 以開啟工作區。這會提示您輸入您在 IAM Identity Center 中設定的使用者名稱和密碼。您應該使用管理員使用者登入，以完成工作區的設定。

1. 在工作區**首頁**中，選擇**應用程式**、**AWS 資料來源**和**資料來源**。

1. 在**資料來源**頁面中，選擇**資料來源**索引標籤。

1. 針對**服務**，選擇 Amazon Managed Service for Prometheus。

1. 在**瀏覽和佈建資料來源**區段中，選擇您佈建 Amazon Managed Service for Prometheus 工作區 AWS 的區域。

1. 從所選區域中的資料來源清單中，為 Amazon Managed Service for Prometheus 的資料來源選擇資料來源。確定您檢查已為 HyperPod 可觀測性堆疊設定的 Amazon Managed Service for Prometheus 工作區的資源 ID 和資源別名。

## 匯入開放原始碼 Grafana 儀表板
<a name="sagemaker-hyperpod-cluster-observability-slurm-managed-grafana-ws-import-dashboards"></a>

成功使用了 Amazon Managed Service for Prometheus 作為資料來源來設定 Amazon Managed Grafana 工作區後，您將開始將指標收集至 Prometheus，然後應該開始查看顯示圖表、資訊等的各種儀表板。Grafana 開放原始碼軟體提供各種儀表板，您可以將其匯入至 Amazon Managed Grafana。

**將開放原始碼 Grafana 儀表板匯入至 Amazon Managed Grafana**

1. 在 Amazon Managed Grafana 工作區的**首頁**中，選擇**儀表板**。

1. 選擇 UI 文字為**新增**的下拉式功能表按鈕，然後選取**匯入**。

1. 將 URL 貼至 [Slurm 儀表板](https://grafana.com/grafana/dashboards/4323-slurm-dashboard/)。

   ```
   https://grafana.com/grafana/dashboards/4323-slurm-dashboard/
   ```

1. 選取**載入**。

1. 重複上述步驟以匯入下列儀表板。

   1. [節點匯出工具完整儀表板](https://grafana.com/grafana/dashboards/1860-node-exporter-full/)

      ```
      https://grafana.com/grafana/dashboards/1860-node-exporter-full/
      ```

   1. [NVIDIA DCGM 匯出工具儀表板](https://grafana.com/grafana/dashboards/12239-nvidia-dcgm-exporter-dashboard/)

      ```
      https://grafana.com/grafana/dashboards/12239-nvidia-dcgm-exporter-dashboard/
      ```

   1. [EFA 指標儀表板](https://grafana.com/grafana/dashboards/20579-efa-metrics-dev/)

      ```
      https://grafana.com/grafana/dashboards/20579-efa-metrics-dev/
      ```

   1. [FSx for Lustre 指標儀表板](https://grafana.com/grafana/dashboards/20906-fsx-lustre/)

      ```
      https://grafana.com/grafana/dashboards/20906-fsx-lustre/
      ```