View a markdown version of this page

Sessões de usuário em segundo plano - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Sessões de usuário em segundo plano

As sessões em segundo plano do usuário permitem que os fluxos de análise e aprendizado de máquina de longa duração continuem mesmo depois que o usuário se desconecta da interface do notebook. Esse recurso é implementado por meio da integração do EMR Serverless com o recurso confiável de propagação de identidade do IAM Identity Center. Esta seção explica as opções de configuração e os comportamentos das sessões em segundo plano do usuário.

nota

As sessões em segundo plano do usuário se aplicam às cargas de trabalho do Spark iniciadas por meio de interfaces de notebook, como o Amazon SageMaker Unified Studio. A ativação ou desativação desse recurso afeta somente as novas sessões do Livy; as sessões ativas existentes do Livy não são afetadas.

Configurar sessões de usuário em segundo plano

As sessões de usuário em segundo plano devem ser habilitadas em dois níveis para que funcionem adequadamente:

  1. Nível de instância do IAM Identity Center — normalmente configurado pelos administradores do iDC

  2. Nível do aplicativo EMR Serverless — configurado pelos administradores do aplicativo EMR Serverless

Habilite sessões em segundo plano do usuário para aplicativos EMR Serverless

Para habilitar sessões em segundo plano do usuário para um aplicativo EMR Serverless, você deve definir o userBackgroundSessionsEnabled parâmetro como true in identityCenterConfiguration ao criar ou atualizar um aplicativo.

Pré-requisitos

  • Sua função do IAM usada create/update no aplicativo EMR Serverless deve ter a permissão. sso:PutApplicationSessionConfiguration Essa permissão permite que o EMR Serverless habilite sessões em segundo plano do usuário no nível do aplicativo iDC gerenciado pelo EMR Serverless.

  • Seu aplicativo EMR Serverless deve usar a etiqueta de versão 7.8 ou posterior e ter a Propagação de Identidade Confiável ativada.

Para habilitar sessões em segundo plano do usuário usando o AWS CLI

aws emr-serverless create-application \ --name "my-analytics-app" \ --type "SPARK" \ --release-label "emr-7.8.0" \ --identity-center-configuration '{"identityCenterInstanceArn": "arn:aws:sso:::instance/ssoins-1234567890abcdef", "userBackgroundSessionsEnabled": true}'

Para atualizar um aplicativo existente:

aws emr-serverless update-application \ --application-id applicationId \ --identity-center-configuration '{"identityCenterInstanceArn": "arn:aws:sso:::instance/ssoins-1234567890abcdef", "userBackgroundSessionsEnabled": true}'

Matriz de configuração

A configuração efetiva da sessão em segundo plano do usuário depende da configuração do aplicativo EMR Serverless e das configurações em nível de instância do IAM Identity Center:

Matriz de configuração da sessão em segundo plano do usuário
Centro de identidade do IAM userBackgroundSession ativado Habilitado para EMR Serverless userBackgroundSessions Comportamento
Sim TRUE Sessões de usuário em segundo plano ativadas
Sim FALSE A sessão expira com o logout do usuário
Não TRUE O aplicativo creation/update falha com exceção
Não FALSE A sessão expira com o logout do usuário

Duração padrão das sessões de usuários em segundo plano

Por padrão, todas as sessões de usuário em segundo plano têm um limite de duração de 7 dias no Centro de Identidade do IAM. Os administradores podem modificar essa duração no console do Centro de Identidade do IAM. Essa configuração se aplica no nível da instância do Centro de Identidade do IAM, afetando todos os aplicativos do Centro de Identidade do IAM compatíveis nessa instância.

  • A duração pode ser definida para qualquer valor, de 15 minutos a 90 dias.

  • Essa configuração é definida no console do IAM Identity Center em ConfiguraçõesAutenticaçãoConfigurar (seção Trabalhos não interativos)

nota

As sessões do EMR Serverless Livy têm um limite de duração máxima separado de 24 horas. As sessões serão encerradas quando o limite da sessão do Livy ou a duração da sessão em segundo plano do usuário forem atingidos, o que ocorrer primeiro.

Impacto de desativar as sessões de usuário em segundo plano

Quando as sessões em segundo plano do usuário são desativadas no IAM Identity Center:

Sessões existentes do Livy

Continue a ser executado sem interrupção se eles tiverem sido iniciados com as sessões em segundo plano do usuário ativadas. Essas sessões continuarão usando seus tokens de sessão em segundo plano existentes até que terminem naturalmente ou sejam explicitamente interrompidas.

Novas sessões de Livy

Usará o fluxo padrão de propagação de identidade confiável e será encerrado quando o usuário se desconectar ou sua sessão interativa expirar (como ao fechar um notebook Amazon SageMaker Unified Studio JupyterLab ).

Alterando a duração das sessões de usuário em segundo plano

Quando a configuração de duração das sessões de usuário em segundo plano é modificada no Centro de Identidade do IAM:

Sessões existentes do Livy

Continue executando com a mesma duração da sessão em segundo plano com a qual eles foram iniciados.

Novas sessões de Livy

Usará a nova duração da sessão para sessões em segundo plano.

Considerações

Condições de encerramento da sessão

Ao usar sessões em segundo plano do usuário, uma sessão do Livy continuará em execução até que uma das seguintes situações ocorra:

  • A sessão em segundo plano do usuário expira (com base na configuração do iDC, em até 90 dias)

  • A sessão de usuário em segundo plano for revogada manualmente por um administrador.

  • A sessão do Livy atinge seu tempo limite de inatividade (padrão: 1 hora após a última instrução executada)

  • A sessão Livy atinge sua duração máxima (24 horas)

  • O usuário interrompe ou reinicia explicitamente o kernel do notebook

Persistência de dados

Ao usar sessões de usuário em segundo plano:

  • Os usuários não podem se reconectar à interface do notebook para visualizar os resultados depois de se desconectarem

  • Configure suas instruções do Spark para gravar os resultados no armazenamento persistente (como o Amazon S3) antes que a execução seja concluída

Implicações de custo

  • Os trabalhos continuarão sendo executados até a conclusão mesmo depois que os usuários encerrarem a JupyterLab sessão do Amazon SageMaker Unified Studio e incorrerão em cobranças por toda a duração da execução concluída.

  • Monitore suas sessões ativas em segundo plano para evitar custos desnecessários de sessões esquecidas ou abandonadas.

Disponibilidade de recursos

As sessões em segundo plano do usuário do EMR Serverless estão disponíveis para:

  • Somente motor Spark (o motor Hive não é suportado)

  • Somente sessões interativas do Livy (trabalhos em lote e trabalhos de streaming não são suportados)

  • Etiquetas de lançamento do EMR Serverless 7.8 e versões posteriores