

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 문제 해결
<a name="sagemaker-hyperpod-studio-troubleshoot"></a>

다음 섹션에서는 Studio의 HyperPod에 대한 문제 해결 솔루션을 나열합니다.

**Topics**
+ [작업 탭](#sagemaker-hyperpod-studio-troubleshoot-tasks)
+ [지표 탭](#sagemaker-hyperpod-studio-troubleshoot-metrics)

## 작업 탭
<a name="sagemaker-hyperpod-studio-troubleshoot-tasks"></a>

**작업** 탭에 있는 동안 Custom Resource Definition (CRD) is not configured on the cluster라는 오류가 발생하는 경우
+ 도메인 실행 역할에 `EKSAdminViewPolicy` 및 `ClusterAccessRole` 정책을 부여합니다.

  실행 역할에 태그를 추가하는 방법에 대한 자세한 내용은 [IAM 역할 태깅](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_tags_roles.html)을 참조하세요.

  IAM 사용자 또는 그룹에 정책을 연결하는 방법을 알아보려면 [IAM 자격 증명 권한 추가 및 제거](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_manage-attach-detach.html)를 참조하세요.

Slurm 지표에 대한 작업 그리드가 **작업** 탭에서 로드를 중지하지 않는 경우
+ [AWS Session Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/session-manager.html) 기본 설정에서 `RunAs`가 활성화되어 있고 사용 중인 역할에 `SSMSessionRunAs` 태그가 연결되어 있는지 확인합니다.
  + `RunAs`를 활성화하려면 [Systems Manager 콘솔](https://console.aws.amazon.com/systems-manager/session-manager)에서 **기본 설정** 탭으로 이동합니다.
  +  [Linux 및 macOS 관리형 노드에 대해 Run As 지원을 활성화합니다](https://docs.aws.amazon.com/systems-manager/latest/userguide/session-preferences-run-as.html).

Studio for EKS 클러스터의 작업 보기를 제한하려면 다음을 수행하세요.
+ 실행 역할에 EKS 클러스터의 네임스페이스를 나열할 권한이 없는 경우
  + [Studio에서 EKS 클러스터에 대한 작업 보기 제한](sagemaker-hyperpod-studio-setup-eks.md#sagemaker-hyperpod-studio-setup-eks-restrict-tasks-view)을(를) 참조하세요.
+ 사용자에게 EKS 클러스터에 대한 액세스에 문제가 있는 경우

  1. 다음 AWS CLI 명령을 실행하여 RBAC가 활성화되어 있는지 확인합니다.

     ```
     kubectl api-versions | grep rbac
     ```

     그러면 rbac.authorization.k8s.io/v1이 반환됩니다.

  1. 다음 명령을 실행하여 `ClusterRole` 및 `ClusterRoleBinding`이 존재하는지 확인합니다.

     ```
     kubectl get clusterrole pods-events-crd-cluster-role
     kubectl get clusterrolebinding pods-events-crd-cluster-role-binding
     ```

  1. 사용자 그룹 멤버십을 확인합니다. 사용자가 ID 제공업체 또는 IAM의 `pods-events-crd-cluster-level` 그룹에 올바르게 할당되었는지 확인합니다.
+ 사용자가 리소스를 볼 수 없는 경우
  + 그룹 멤버십을 확인하고 `ClusterRoleBinding`이 올바르게 적용되었는지 확인합니다.
+ 사용자가 모든 네임스페이스에서 리소스를 볼 수 있는 경우
  + 네임스페이스 제한이 필요한 경우 `ClusterRole` 및 `ClusterRoleBinding` 대신 `Role` 및 `RoleBinding`을 사용하는 것을 고려해 보세요.
+ 구성이 올바른 것으로 보이지만 권한이 적용되지 않는 경우
  + 액세스를 방해하는 `NetworkPolicies` 또는 `PodSecurityPolicies`가 있는지 확인합니다.

## 지표 탭
<a name="sagemaker-hyperpod-studio-troubleshoot-metrics"></a>

**지표** 탭에 표시된 Amazon CloudWatch 지표가 없는 경우
+ HyperPod 클러스터 세부 정보의 `Metrics` 섹션은 CloudWatch를 사용하여 데이터를 가져옵니다. 이 섹션의 지표를 보려면 [클러스터 및 작업 관찰성](sagemaker-hyperpod-eks-cluster-observability-cluster.md)을 활성화해야 합니다. 관리자에게 문의하여 지표를 구성하세요.