

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# AWS Batch SageMaker AI 훈련 작업에 대한 지원
<a name="training-job-queues"></a>

[AWS Batch 작업 대기열](https://docs.aws.amazon.com/batch/latest/userguide/job_queues.html)은 컴퓨팅 리소스에서 실행되기 전에 제출된 작업을 저장하고 우선순위를 지정합니다. SageMaker AI 훈련 작업을 작업 대기열에 제출하여에서 제공하는 서버리스 작업 예약 및 우선순위 지정 도구를 활용할 수 있습니다 AWS Batch.

## 작동 방식
<a name="training-job-queues-how-it-works"></a>

다음 단계에서는 SageMaker AI 훈련 작업에서 AWS Batch 작업 대기열을 사용하는 방법의 워크플로를 설명합니다. 자세한 자습서 및 예시 노트북은 [시작하기](#training-job-queues-get-started) 섹션을 참조하세요.
+  AWS Batch 및 필요한 권한을 설정합니다. 자세한 내용은 *AWS Batch 사용 설명서*에서 [AWS Batch설정](https://docs.aws.amazon.com/batch/latest/userguide/get-set-up-for-aws-batch.html)을 참조하세요.
+ 콘솔에서 또는를 사용하여 AWS CLI다음 AWS Batch 리소스를 생성합니다.
  + [서비스 환경](https://docs.aws.amazon.com/batch/latest/userguide/service-environments.html) - SageMaker AI와 통합하기 위한 구성 파라미터를 포함합니다.
  + [SageMaker AI 훈련 작업 대기열](https://docs.aws.amazon.com/batch/latest/userguide/create-sagemaker-job-queue.html) - SageMaker AI와 통합하여 훈련 작업을 제출합니다.
+ SageMaker AI 훈련 작업에 대해 훈련 컨테이너 이미지와 같은 세부 정보 및 요청을 구성합니다. 훈련 작업을 AWS Batch 대기열에 제출하려면 AWS CLI AWS SDK for Python (Boto3)또는 SageMaker AI Python SDK를 사용할 수 있습니다.
+ 훈련 작업을 작업 대기열에 제출합니다. 다음 옵션을 사용하여 작업을 제출할 수 있습니다.
  +  AWS Batch [SubmitServiceJob](https://docs.aws.amazon.com/batch/latest/APIReference/API_SubmitServiceJob.html) API를 사용합니다.
  + SageMaker AI Python SDK에서 [`aws_batch` 모듈](https://github.com/aws/sagemaker-python-sdk/tree/master/src/sagemaker/aws_batch)을 가져옵니다. TrainingQueue 객체와 모델 훈련 객체(예: 예측기 또는 ModelTrainer)를 생성한 후 `queue.submit()` 메서드를 사용하여 훈련 작업을 TrainingQueue에 제출할 수 있습니다.
+ 작업을 제출한 후 콘솔, AWS Batch [DescribeServiceJob](https://docs.aws.amazon.com/batch/latest/APIReference/API_DescribeServiceJob.html) API 또는 SageMaker AI [DescribeTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingJob.html) API를 AWS Batch 사용하여 작업 대기열 및 작업 상태를 확인합니다.

## 비용 및 가용성
<a name="training-job-queues-cost-availability"></a>

훈련 작업 요금에 대한 자세한 내용은 [Amazon SageMaker AI Pricing](https://aws.amazon.com/sagemaker-ai/pricing/)을 참조하세요. AWS Batch를 사용하면 Amazon EC2 인스턴스와 같이 사용된 모든 AWS 리소스에 대해서만 비용을 지불합니다. 자세한 내용은 [AWS Batch 요금](https://aws.amazon.com/batch/pricing/)을 참조하십시오.

훈련 작업을 사용할 수 AWS 리전 있는 모든에서 AWS Batch SageMaker AI 훈련 작업에를 사용할 수 있습니다. 자세한 내용은 [Amazon SageMaker 엔드포인트 및 할당량](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html)을 참조하세요.

필요할 때 필요한 용량을 확보하려면 SageMaker AI Flexible Training Plans(FTP)을 사용할 수 있습니다. 이러한 계획을 통해 훈련 작업의 용량을 예약할 수 있습니다. AWS Batch의 대기열 기능과 결합하면 플랜 기간 동안 사용률을 극대화할 수 있습니다. 자세한 내용은 [Reserve training plans for you training jobs or HyperPod clusters](https://docs.aws.amazon.com/sagemaker/latest/dg/reserve-capacity-with-training-plans.html)를 참조하세요.

## 시작하기
<a name="training-job-queues-get-started"></a>

 AWS Batch 작업 대기열을 설정하고 SageMaker AI 훈련 작업을 제출하는 방법에 대한 자습서는 *AWS Batch 사용 설명서*[AWS Batch 의 SageMaker AI에서 시작하기](https://docs.aws.amazon.com/batch/latest/userguide/getting-started-sagemaker.html)를 참조하세요.

SageMaker AI Python SDK에서 `aws_batch` 모듈을 사용하는 방법을 보여주는 Jupyter Notebook의 경우 [amazon-sagemaker-examples GitHub 리포지토리의 SageMaker AI 훈련 작업의AWS Batch 노트북 예시](https://github.com/aws/amazon-sagemaker-examples/tree/default/%20%20%20%20%20%20build_and_train_models/sm-training-queues)를 참조하세요.