

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# GPU 파티션 할당량 할당
<a name="sagemaker-hyperpod-eks-operate-console-ui-governance-policies-compute-allocation-gpu-partitions"></a>

GPU 파티셔닝을 지원하도록 컴퓨팅 할당량 할당을 확장하여 GPU 파티션 수준에서 세분화된 리소스 공유를 활성화할 수 있습니다. 클러스터의 지원되는 GPUs에서 GPU 파티셔닝이 활성화되면 각 물리적 GPU를 컴퓨팅, 메모리 및 스트리밍 멀티프로세서 할당이 정의된 격리된 GPUs로 파티셔닝할 수 있습니다. GPU 파티셔닝에 대한 자세한 내용은 섹션을 참조하세요[Amazon SageMaker HyperPod에서 GPU 파티션 사용](sagemaker-hyperpod-eks-gpu-partitioning.md). 팀에 특정 GPU 파티션을 할당하여 여러 팀이 하드웨어 수준의 격리와 예측 가능한 성능을 유지하면서 단일 GPU를 공유할 수 있습니다.

예를 들어 H100 GPUs가 8개인 ml.p5.48xlarge 인스턴스를 GPU 파티션으로 분할할 수 있으며, 작업 요구 사항에 따라 여러 팀에 개별 파티션을 할당할 수 있습니다. GPU 파티션 할당을 지정하면 HyperPod 작업 거버넌스는 GPU 수준 할당과 마찬가지로 GPU 파티션을 기반으로 비례 vCPU 및 메모리 할당량을 계산합니다. 이 접근 방식은 유휴 용량을 제거하고 동일한 물리적 GPU의 여러 동시 작업에서 비용 효율적인 리소스 공유를 지원하여 GPU 사용률을 극대화합니다.

## 컴퓨팅 할당량 생성
<a name="sagemaker-hyperpod-eks-operate-console-ui-governance-policies-compute-allocation-gpu-partitions-creating"></a>

```
aws sagemaker create-compute-quota \
  --name "fractional-gpu-quota" \
  --compute-quota-config '{
    "ComputeQuotaResources": [
      {
        "InstanceType": "ml.p4d.24xlarge",
        "AcceleratorPartition": {
            "Count": 4,
            "Type": "mig-1g.5gb"
        }
      }
    ],
    "ResourceSharingConfig": { 
      "Strategy": "LendAndBorrow", 
      "BorrowLimit": 100 
    }
  }'
```

## 할당량 리소스 확인
<a name="sagemaker-hyperpod-eks-operate-console-ui-governance-policies-compute-allocation-gpu-partitions-verifying"></a>

```
# Check ClusterQueue
kubectl get clusterqueues
kubectl describe clusterqueue QUEUE_NAME

# Check ResourceFlavors
kubectl get resourceflavor
kubectl describe resourceflavor FLAVOR_NAME
```