기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SageMaker용 사용자 지정 Docker 컨테이너 이미지를 생성하고 이를 AWS Step Functions의 모델 교육에 사용합니다.
Julia Bluszcz, Aubrey Oosthuizen, Mohan Gowda Purushothama, Neha Sharma, Mateusz Zaremba, Amazon Web Services
요약
이 패턴은 Amazon SageMaker용 Docker 컨테이너 이미지를 생성하고 이를 AWS Step Functions의 교육 모델로 사용하는 방법을 보여줍니다. 컨테이너에 사용자 정의 알고리즘을 패키징하면 프로그래밍 언어, 환경, 프레임워크, 종속성에 상관없이 SageMaker에서 거의 모든 코드를 사용할 수 있습니다.
제공된 SageMaker 노트북 예제에서는 Amazon Elastic Container Registry(Amazon ECR)에 사용자 지정 Docker 컨테이너 이미지를 저장합니다. 그러면 Step Functions는 Amazon ECR에 저장된 컨테이너를 사용하여 Python SageMaker 처리 스크립트를 실행합니다. 그리고 나서, 컨테이너는 Amazon Simple Storage Service(S3)로 모델을 내보냅니다.
사전 조건 및 제한 사항
사전 조건
활성 상태의 계정.
Amazon S3 권한을 가진 SageMaker AWS Identity and Access Management (IAM) 역할
Python에 대한 지식
Amazon SageMaker Python SDK에 대한 지식
AWS Command Line Interface(AWS CLI)에 대한 지식
AWS SDK for Phyton(Boto3)에 대한 지식
Amazon ECR에 대한 지식
Docker에 대한 지식
제품 버전
AWS Step Functions Data Science SDK v2.3.0
Amazon SageMaker Python SDK 버전 2.78.0
아키텍처
다음 다이어그램은 SageMaker용 Docker 컨테이너 이미지를 만든 다음 Step Functions에서 교육 모델에 사용하는 예제 워크플로우를 보여줍니다.

이 다이어그램은 다음 워크플로를 보여줍니다.
데이터 사이언티스트 또는 DevOps 엔지니어는 SageMaker 노트북을 사용하여 사용자 지정 Docker 컨테이너 이미지를 생성합니다.
데이터 사이언티스트 또는 DevOps 엔지니어는 Docker 컨테이너 이미지를 프라이빗 레지스트리에 있는 Amazon ECR 프라이빗 리포지토리에 저장합니다.
데이터 사이언티스트나 DevOps 엔지니어는 Docker 컨테이너를 사용하여 Step Functions 워크플로우에서 Python SageMaker 처리 작업을 실행합니다.
자동화 및 규모 조정
이 패턴의 예제 SageMaker 노트북은 ml.m5.xlarge 노트북 인스턴스 유형을 사용합니다. 사용 사례에 맞게 인스턴스 유형을 변경할 수 있습니다. SageMaker 노트북 인스턴스 유형에 대한 자세한 내용은 Amazon SageMaker 요금
도구
Amazon Elastic Container Registry(Amazon ECR)는 안전하고 확장 가능하고 신뢰할 수 있는 관리형 컨테이너 이미지 레지스트리 서비스입니다.
Amazon SageMaker는 ML 모델을 구축하고 훈련시킨 후 모델을 프로덕션 지원 호스팅 환경에 배포할 수 있는 관리형 기계 학습(ML) 서비스입니다.
Amazon SageMaker Python SDK
는 SageMaker에서 기계 학습 모델을 교육하고 배포하기 위한 오픈 소스 라이브러리입니다. AWS Step Functions은 Lambda 함수와 기타 AWS 서비스를 결합할 수 있는 서버리스 오케스트레이션 서비스로, 비즈니스 크리티컬 애플리케이션을 구축합니다.
AWS Step Functions Data Science Python SDK
는 기계 학습 모델을 처리하고 게시하는 Step Functions 워크플로우를 쉽게 생성할 수 있는 오픈 소스 라이브러리입니다.
에픽
| 작업 | 설명 | 필요한 기술 |
|---|---|---|
Amazon ECR을 설정하고 새 프라이빗 레지스트리를 생성합니다. | 아직 설정하지 않았다면 Amazon ECR 사용 설명서의 Amazon ECR로 설정에 나와 있는 지침에 따라 Amazon ECR을 설정합니다. 각 AWS 계정은 기본 프라이빗 Amazon ECR 레지스트리와 함께 제공됩니다. | DevOps 엔지니어 |
Amazon ECR 프라이빗 리포지토리를 생성합니다. | Amazon ECR 사용 설명서의 프라이빗 리포지토리 생성의 지침을 따릅니다. 참고참고: 생성한 리포지토리는 사용자 지정 Docker 컨테이너 이미지를 저장하는 곳입니다. | DevOps 엔지니어 |
SageMaker 처리 작업을 실행하는 데 필요한 사양이 포함된 Dockerfile을 생성합니다. | Dockerfile을 구성하여 SageMaker 처리 작업을 실행하는 데 필요한 사양이 포함된 Dockerfile을 생성합니다. 지침은 Amazon SageMaker 개발자 가이드의 자체 교육 컨테이너에 맞게 조정을 참조하세요. Dockerfile에 대한 자세한 내용은 Docker 설명서의 Dockerfile 참조 Dockerfile을 생성하기 위한 Jupyter Notebook 코드 셀의 예 셀 1
셀 2
| DevOps 엔지니어 |
Docker 컨테이너 이미지를 구축하고 Amazon ECR에 푸시합니다. |
자세한 내용은 GitHub에 있는 자체 알고리즘 컨테이너 빌드의 컨테이너 빌드 및 등록 Docker 이미지를 빌드하고 등록하기 위한 Jupyter Notebook 코드 셀의 예 중요중요: 다음 셀을 실행하기 전에 Dockerfile을 생성하여 라는 디렉터리에 저장했는지 확인합니다. 또한 Amazon ECR 리포지토리를 생성했는지 확인하고 첫 번째 셀의 셀 1
셀 2
셀 3
셀 4
참고참고: 및 명령을 사용할 수 있도록 Docker 클라이언트를 프라이빗 레지스트리에 인증해야 합니다. 이러한 명령은 레지스트리의 리포지토리로 이미지를 푸시하거나 가져옵니다. | DevOps 엔지니어 |
| 작업 | 설명 | 필요한 기술 |
|---|---|---|
사용자 지정 처리 및 모델 학습 로직이 포함된 Python 스크립트를 생성합니다. | 데이터 처리 스크립트에서 실행할 사용자 지정 처리 로직을 작성합니다. 그런 다음 이라는 이름이 자세한 내용은 GitHub의 SageMaker 스크립트 모드를 사용하여 자체 모델 가져오기 사용자 지정 처리 및 모델 학습 로직이 포함된 예제 Python 스크립트
| 데이터 과학자 |
SageMaker 프로세싱 작업을 단계 중 하나로 포함하는 Step Functions 워크플로우를 생성합니다. | AWS Step Functions 데이터 과학 SDK 중요중요: AWS 계정에서 Step Functions에 대한 IAM 실행 역할을 생성했는지 확인합니다. Amazon S3에 업로드하기 위한 예제 환경 설정 및 사용자 지정 교육 스크립트
사용자 지정 Amazon ECR 이미지와 Python 스크립트를 사용하는 SageMaker 처리 단계 정의 예시 참고참고: 파라미터를 사용하여 작업 이름을 지정해야 합니다. 파라미터 값은 작업이 실행될 때마다 고유해야 합니다. 또한 training.py 파일의 코드는
SageMaker 처리 작업을 실행하는 Step Functions 워크플로우 예시 참고참고: 이 예제 워크플로우에는 SageMaker 처리 작업 단계만 포함되며 전체 Step Functions 워크플로우는 포함되지 않습니다. 전체 예제 워크플로우는 AWS Step Functions Data Science SDK 설명서의 SageMaker의 예제 노트북
| 데이터 과학자 |
관련 리소스
데이터 처리(Amazon SageMaker 개발자 가이드)
자체 교육 컨테이너에 맞게 조정(Amazon SageMaker 개발자 가이드)