View a markdown version of this page

Sesiones de usuario en segundo plano - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Sesiones de usuario en segundo plano

Las sesiones de usuario en segundo plano permiten que los flujos de análisis y aprendizaje automático de larga duración continúen incluso después de que el usuario haya cerrado sesión en la interfaz de su portátil. Esta capacidad se implementa mediante la integración sin servidor de EMR con la función de propagación de identidad confiable de IAM Identity Center. En esta sección se explican las opciones de configuración y los comportamientos de las sesiones en segundo plano de los usuarios.

nota

Las sesiones de usuario en segundo plano se aplican a las cargas de trabajo de Spark iniciadas a través de interfaces de notebook como Amazon SageMaker Unified Studio. La activación o desactivación de esta función solo afecta a las nuevas sesiones de Livy; las sesiones de Livy activas existentes no se ven afectadas.

Configuración de sesiones de usuario en segundo plano

Las sesiones de usuario en segundo plano deben estar habilitadas en dos niveles para que funcionen correctamente:

  1. Nivel de instancia del IAM Identity Center: normalmente lo configuran los administradores de iDC

  2. Nivel de aplicación EMR Serverless: configurado por los administradores de aplicaciones EMR Serverless

Habilite las sesiones de usuario en segundo plano para las aplicaciones EMR Serverless

Para habilitar las sesiones de usuario en segundo plano para una aplicación EMR sin servidor, debe establecer el userBackgroundSessionsEnabled parámetro true en el identityCenterConfiguration al crear o actualizar una aplicación.

Requisitos previos

  • La función de IAM que se utiliza en create/update la aplicación EMR Serverless debe tener el permiso. sso:PutApplicationSessionConfiguration Este permiso permite a EMR Serverless habilitar las sesiones en segundo plano del usuario en el nivel de aplicación iDC gestionada por EMR Serverless.

  • Su aplicación EMR Serverless debe usar la etiqueta de versión 7.8 o posterior y debe estar habilitada para la propagación de identidad confiable.

Para habilitar las sesiones en segundo plano de los usuarios mediante AWS CLI

aws emr-serverless create-application \ --name "my-analytics-app" \ --type "SPARK" \ --release-label "emr-7.8.0" \ --identity-center-configuration '{"identityCenterInstanceArn": "arn:aws:sso:::instance/ssoins-1234567890abcdef", "userBackgroundSessionsEnabled": true}'

Para actualizar una aplicación existente:

aws emr-serverless update-application \ --application-id applicationId \ --identity-center-configuration '{"identityCenterInstanceArn": "arn:aws:sso:::instance/ssoins-1234567890abcdef", "userBackgroundSessionsEnabled": true}'

Matriz de configuración

La configuración efectiva de la sesión en segundo plano del usuario depende tanto de la configuración de la aplicación EMR Serverless como de la configuración a nivel de instancia de IAM Identity Center:

Matriz de configuración de sesiones de usuario en segundo plano
Centro userBackgroundSession de identidad de IAM activado EMR sin servidor habilitado userBackgroundSessions Comportamiento
TRUE Sesiones de usuario en segundo plano habilitadas
FALSO La sesión caduca al cerrar sesión del usuario
No TRUE La aplicación creation/update falla con una excepción
No FALSO La sesión caduca al cerrar sesión del usuario

Duración predeterminada de la sesión de usuario en segundo plano

De forma predeterminada, todas las sesiones de usuario en segundo plano tienen un límite de duración de 7 días en IAM Identity Center. Los administradores pueden modificar esta duración en la consola de IAM Identity Center. Esta configuración se aplica a la instancia de IAM Identity Center y afecta a todas las aplicaciones de IAM Identity Center dentro de dicha instancia.

  • La duración se puede establecer en cualquier valor, desde 15 minutos hasta 90 días.

  • Este ajuste se configura en la consola del IAM Identity Center, en ConfiguraciónAutenticaciónConfigurar (sección Trabajos no interactivos)

nota

Las sesiones de EMR Serverless Livy tienen un límite de duración máxima independiente de 24 horas. Las sesiones finalizarán cuando se alcance el límite de sesiones de Livy o la duración de la sesión en segundo plano del usuario, lo que ocurra primero.

Impacto de la deshabilitación de las sesiones en segundo plano de los usuarios

Cuando las sesiones de usuario en segundo plano están deshabilitadas en el Centro de identidad de IAM:

Sesiones de Livy existentes

Continúan ejecutándose sin interrupción si se iniciaron con las sesiones de usuario en segundo plano habilitadas. Estas sesiones seguirán utilizando sus identificadores de sesión en segundo plano hasta que finalicen de forma natural o se detengan explícitamente.

Nuevas sesiones de Livy

Utilizará el flujo de propagación de identidad confiable estándar y finalizará cuando el usuario cierre la sesión o caduque su sesión interactiva (por ejemplo, al cerrar un JupyterLab bloc de notas de Amazon SageMaker Unified Studio).

Cambio de la duración de las sesiones en segundo plano de los usuarios

Cuando se modifica la configuración de duración de las sesiones en segundo plano de los usuarios en IAM Identity Center:

Sesiones de Livy existentes

Continúe ejecutándose con la misma duración de sesión en segundo plano con la que se iniciaron.

Nuevas sesiones de Livy

Utilizará la nueva duración de la sesión para las sesiones en segundo plano.

Consideraciones

Condiciones de finalización de la sesión

Cuando se utilizan sesiones de usuario en segundo plano, las sesiones de Livy seguirán ejecutándose hasta que se produzca una de las siguientes situaciones:

  • La sesión en segundo plano de los usuarios caduque (según la configuración de IdC, hasta 90 días)

  • Un administrador revoque manualmente la sesión en segundo plano de los usuarios

  • La sesión de Livy alcanza su tiempo de espera de inactividad (predeterminado: 1 hora después de la última sentencia ejecutada)

  • La sesión de Livy alcanza su duración máxima (24 horas)

  • El usuario detiene o reinicia el núcleo del cuaderno de forma explícita

Persistencia de datos

Cuando se utilizan sesiones de usuario en segundo plano:

  • Los usuarios no pueden volver a conectarse a la interfaz de su cuaderno para ver los resultados una vez que han cerrado sesión

  • Configure sus instrucciones de Spark para escribir los resultados en un almacenamiento persistente (como Amazon S3) antes de que se complete la ejecución

Implicaciones de costos

  • Los trabajos seguirán ejecutándose hasta completarse incluso después de que los usuarios finalicen su JupyterLab sesión de Amazon SageMaker Unified Studio y se cobrarán durante toda la ejecución.

  • Supervise sus sesiones en segundo plano activas para evitar costes innecesarios derivados de sesiones olvidadas o abandonadas.

Disponibilidad de características

Las sesiones de usuario en segundo plano para EMR Serverless están disponibles para:

  • Solo el motor Spark (el motor Hive no es compatible)

  • Solo sesiones interactivas de Livy (no se admiten los trabajos por lotes ni los trabajos de streaming)

  • Etiquetas de lanzamiento EMR Serverless 7.8 y versiones posteriores