

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 기능 및 기능
<a name="emr-spark-upgrade-agent-features"></a>

## 지원되는 기술
<a name="emr-spark-upgrade-agent-supported-technologies"></a>
+ **언어**: Python 및 Scala 애플리케이션
+ **빌드 시스템**: Scala 프로젝트용 Maven 및 SBT, requirements.txt, Pipfile 및 Python 프로젝트용 Setuptools
+ **대상 플랫폼**: Amazon EMR 및 EMR Serverless
+ **지원되는 버전**: 버전 2.4에서 3.5로의 Apache Spark 업그레이드를 지원합니다. 해당 배포 모드 매핑은 다음과 같습니다.
  + **EMR-EC2의 경우**
    + **소스 버전:** EMR 5.20.0 이상
    + **대상 버전:** EMR 7.12.0 이하, EMR 5.20.0 이상이어야 함
  + **EMR Serverless의 경우**
    + **소스 버전:** EMR Serverless 6.6.0 이상
    + **대상 버전:** EMR Serverless 7.12.0 이하

## 업그레이드 대상
<a name="emr-spark-upgrade-agent-what-we-upgrade"></a>

업그레이드 에이전트는 포괄적인 Spark 애플리케이션 업그레이드를 제공합니다.
+ **빌드 구성**: 종속성 관리 파일(pom.xml, requirements.txt 등) 자동 업데이트
+ **소스 코드**: API 호환성 문제 및 더 이상 사용되지 않는 메서드 사용 수정
+ **테스트 코드**: 유닛 및 통합 테스트가 대상 Spark 버전과 함께 작동하는지 확인합니다.
+ **종속성**: 패키징된 종속성을 대상 EMR 버전과 호환되는 버전으로 업그레이드합니다.
+ **검증**: 대상 EMR 클러스터에서 애플리케이션을 컴파일하고 검증합니다.
+ **데이터 품질 분석**: 스키마 차이, 값 수준 통계 드리프트(min/max/mean) 및 집계 행 수 불일치를 감지하고 자세한 영향 보고를 제공합니다.

## 사용 가능한 리전
<a name="emr-spark-upgrade-agent-available-regions"></a>

Spark 업그레이드 에이전트는 다음 리전에서 사용할 수 있습니다.
+ **아시아 태평양**: 도쿄(ap-northeast-1), 서울(ap-northeast-2), 싱가포르(ap-southeast-1), 시드니(ap-southeast-2), 뭄바이(ap-south-1)
+ **북미**: 캐나다(ca-central-1)
+ **유럽**: 스톡홀름(eu-north-1), 아일랜드(eu-west-1), 런던(eu-west-2), 파리(eu-west-3), 프랑크푸르트(eu-central-1)
+ **남아메리카**: 상파울루(sa-east-1)
+ **미국**: 버지니아 북부(us-east-1), 오하이오(us-east-2), 오리건(us-west-2)

## 업그레이드 범위 및 사용자 요구 사항
<a name="emr-spark-upgrade-agent-scope-limitations"></a>
+ **클러스터 관리**: Spark 업그레이드 에이전트는 애플리케이션 코드 업그레이드에 중점을 둡니다. 새 버전의 대상 EMR 클러스터는 사용자가 생성하고 관리해야 합니다.
+ **부트스트랩 작업**: Spark 업그레이드 에이전트는 Spark 애플리케이션 코드 외부에서 사용자 지정 부트스트랩 스크립트를 업그레이드하지 않습니다. 사용자가 업그레이드해야 합니다.
+ **빌드 및 테스트용 업그레이드**: 업그레이드 에이전트는 개발 환경에서 빌드를 수행하고 유닛 및 통합 테스트를 로컬로 실행하여 애플리케이션이 대상 Spark 버전으로 성공적으로 컴파일되는지 확인합니다. 로컬 실행을 위한 Spark 애플리케이션 코드에 대한 제한(보안 정책, 리소스 제한, 네트워크 제한 또는 기업 지침)이 있는 경우 [ Amazon SageMaker Unified Studio VSCode IDE Spaces](https://docs.aws.amazon.com/sagemaker-unified-studio/latest/userguide/create-space.html) 또는 EC2를 사용하여 업그레이드 에이전트를 실행하는 것이 좋습니다. 업그레이드 에이전트는 대상 EMR-EC2 클러스터 또는 EMR-S 애플리케이션을 사용하여 end-to-end.
+ **오류 중심 접근** 방식: 업그레이드 에이전트는 오류 중심 방법론을 사용하여 한 번에 여러 수정 사항이 아닌 컴파일 또는 런타임 오류를 기반으로 한 번에 하나의 수정 작업을 수행합니다. 이 반복적 접근 방식을 사용하면 다음 단계로 진행하기 전에 각 문제를 적절하게 해결할 수 있습니다.
+ **프라이빗 종속성**: 프라이빗 아티팩트 리포지토리에서 설치된 종속성은이 프로세스의 일부로 자동으로 업그레이드할 수 없습니다. 사용자가 업그레이드해야 합니다.
+ **리전 리소스**: Spark 업그레이드 에이전트는 리전이며 업그레이드 프로세스에 해당 리전의 기본 EMR 리소스를 사용합니다. 리전 간 업그레이드는 지원되지 않습니다.