기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다. # Amazon EMR on EKS에서 보안 및 Spark 운영자 Spark 운영자를 사용하는 경우 클러스터 액세스 권한을 설정하는 몇 가지 방법이 있습니다. 첫 번째에서는 역할 기반 액세스 제어를 사용합니다. 역할 기반 액세스 제어(RBAC)는 조직 내 개인의 역할에 따라 액세스를 제한합니다. 액세스를 처리하는 기본적인 방법이 되었습니다. 두 번째 액세스 방법은 할당된 특정 권한을 통해 리소스 액세스를 제공하는 AWS Identity and Access Management 역할을 수임하는 것입니다. **Topics** + [역할 기반 액세스 제어(RBAC)를 사용하여 클러스터 액세스 권한 설정](spark-operator-security-rbac.md) + [서비스 계정에 대한 IAM 역할(IRSA)을 사용하여 클러스터 액세스 권한 설정](spark-operator-security-irsa.md) # 역할 기반 액세스 제어(RBAC)를 사용하여 클러스터 액세스 권한 설정 Spark 운영자를 배포하기 위해 Amazon EMR on EKS는 Spark 운영자와 Spark 앱을 위한 두 가지 역할 및 서비스 계정을 생성합니다. **Topics** + [운영자 서비스 계정 및 역할](#spark-operator-sa-oper) + [Spark 서비스 계정 및 역할](#spark-operator-sa-spark) ## 운영자 서비스 계정 및 역할 Amazon EMR on EKS는 Spark 작업 및 기타 리소스(예: 서비스)와 관련된 `SparkApplications`를 관리할 **운영자 서비스 계정 및 역할**을 생성합니다. 이 서비스 계정의 기본 이름은 `emr-containers-sa-spark-operator`입니다. 이 서비스 역할에는 다음 규칙이 적용됩니다. ``` rules: - apiGroups: - "" resources: - pods verbs: - "*" - apiGroups: - "" resources: - services - configmaps - secrets verbs: - create - get - delete - update - apiGroups: - extensions - networking.k8s.io resources: - ingresses verbs: - create - get - delete - apiGroups: - "" resources: - nodes verbs: - get - apiGroups: - "" resources: - events verbs: - create - update - patch - apiGroups: - "" resources: - resourcequotas verbs: - get - list - watch - apiGroups: - apiextensions.k8s.io resources: - customresourcedefinitions verbs: - create - get - update - delete - apiGroups: - admissionregistration.k8s.io resources: - mutatingwebhookconfigurations - validatingwebhookconfigurations verbs: - create - get - update - delete - apiGroups: - sparkoperator.k8s.io resources: - sparkapplications - sparkapplications/status - scheduledsparkapplications - scheduledsparkapplications/status verbs: - "*" {{- if .Values.batchScheduler.enable }} # required for the `volcano` batch scheduler - apiGroups: - scheduling.incubator.k8s.io - scheduling.sigs.dev - scheduling.volcano.sh resources: - podgroups verbs: - "*" {{- end }} {{ if .Values.webhook.enable }} - apiGroups: - batch resources: - jobs verbs: - delete {{- end }} ``` ## Spark 서비스 계정 및 역할 Spark 드라이버 포드에는 포드와 동일한 네임스페이스에 있는 Kubernetes 서비스 계정이 필요합니다. 이 서비스 계정에는 실행기 포드의 생성, 가져오기, 나열, 패치, 삭제 권한과 드라이버용 Kubernetes 헤드리스 서비스의 생성 권한이 필요합니다. 포드 네임스페이스의 기본 서비스 계정에 필요한 권한이 없으면 드라이버가 실패하고 서비스 계정 없이 종료됩니다. 이 서비스 계정의 기본 이름은 `emr-containers-sa-spark`입니다. 이 서비스 역할에는 다음 규칙이 적용됩니다. ``` rules: - apiGroups: - "" resources: - pods verbs: - "*" - apiGroups: - "" resources: - services verbs: - "*" - apiGroups: - "" resources: - configmaps verbs: - "*" - apiGroups: - "" resources: - persistentvolumeclaims verbs: - "*" ``` # 서비스 계정에 대한 IAM 역할(IRSA)을 사용하여 클러스터 액세스 권한 설정 이 섹션에서는 예를 사용하여 AWS Identity and Access Management 역할을 수임하도록 Kubernetes 서비스 계정을 구성하는 방법을 보여줍니다. 그런 다음 서비스 계정을 사용하는 포드는 역할에 액세스 권한이 있는 모든 AWS 서비스에 액세스할 수 있습니다. 다음 예제에서는 Spark 애플리케이션을 실행하여 Amazon S3에 있는 파일의 단어 수를 계산합니다. 이를 위해 서비스 계정에 대한 IAM 역할(IRSA)을 설정하여 Kubernetes 서비스 계정을 인증하고 권한을 부여할 수 있습니다. **참고** 이 예제에서는 Spark 운영자의 'spark-operator' 네임스페이스와 Spark 애플리케이션을 제출하는 네임스페이스를 사용합니다. ## 사전 조건 이 페이지의 예제를 사용하기 전에 다음 필수 조건을 완료합니다. + [Spark 운영자를 설정합니다](). + [Spark 운영자 설치](spark-operator-gs.md#spark-operator-install). + [Amazon S3 버킷을 생성](https://docs.aws.amazon.com/AmazonS3/latest/userguide/creating-bucket.html)합니다. + 좋아하는 시를 `poem.txt` 텍스트 파일에 저장하고 파일을 S3 버킷에 업로드합니다. 이 페이지에서 생성한 Spark 애플리케이션이 텍스트 파일의 내용을 읽습니다. S3에 파일을 업로드하는 방법에 대한 자세한 내용은 *Amazon Simple Storage Service 사용 설명서*에서 [버킷에 객체 업로드](https://docs.aws.amazon.com/AmazonS3/latest/userguide/uploading-an-object-bucket.html)를 참조하세요. ## IAM 역할을 수임하도록 Kubernetes 서비스 계정 구성 다음 단계를 사용하여 포드가 액세스 권한이 있는 서비스에 액세스하는 데 사용할 수 있는 IAM 역할을 수임하도록 Kubernetes AWS 서비스 계정을 구성합니다. 1. 를 완료한 후 [사전 조건](#spark-operator-security-irsa-prereqs) AWS Command Line Interface 를 사용하여 Amazon S3에 업로드한 `example-policy.json` 파일에 대한 읽기 전용 액세스를 허용하는 파일을 생성합니다. ``` cat >example-policy.json <spark-rbac.yaml < [Kubernetes 서비스 계정 구성]() 후 [사전 조건](#spark-operator-security-irsa-prereqs)의 일부로 업로드한 텍스트 파일의 단어 수를 계산하는 Spark 애플리케이션을 실행할 수 있습니다. 1. Amazon EMR 버전 6을 기반으로 단어 수 계산 애플리케이션을 위한 `SparkApplication` 정의를 사용하여 새 파일 `word-count.yaml`을 만듭니다. ``` cat >word-count.yaml <word-count.yaml <