

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Présentation des blocs-notes Amazon EMR
<a name="emr-managed-notebooks"></a>

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

Vous pouvez utiliser Amazon EMR Notebooks ainsi que des clusters Amazon EMR [exécutant Apache](https://aws.amazon.com/emr/features/spark/) Spark pour créer et [ouvrir](https://jupyter.org) Jupyter Notebook et des JupyterLab interfaces au sein de la console Amazon EMR. Le bloc-notes EMR est un bloc-notes « sans serveur » que vous pouvez utiliser pour exécuter des requêtes et du code. Contrairement à un bloc-notes traditionnel, le contenu d'un bloc-notes EMR, c'est-à-dire les équations, les requêtes, les modèles, le code et le texte narratif contenus dans les cellules du bloc-notes, s'exécute dans un client. Les commandes sont exécutées à l'aide d'un noyau sur le cluster EMR. Le contenu des blocs-notes est également sauvegardé sur Amazon S3 séparément des données du cluster pour une plus grande durabilité et une réutilisation plus souple.

Vous pouvez démarrer un cluster, y attacher un bloc-notes EMR pour analyse, puis mettre fin au cluster. Vous pouvez également fermer un bloc-notes relié à un cluster en cours d'exécution et basculer vers un autre. Plusieurs utilisateurs peuvent attacher simultanément des blocs-notes au même cluster et partager entre eux des fichiers de blocs-notes sur Amazon S3. Ces fonctionnalités vous permettent d'exécuter des clusters à la demande afin d'économiser des coûts et de réduire le temps consacré à la reconfiguration des blocs-notes pour différents clusters et ensembles de données.

Vous pouvez également exécuter un bloc-notes EMR par programmation à l'aide de l'API Amazon EMR, sans avoir à interagir avec la console Amazon EMR (« exécution sans tête »). Vous devez inclure une cellule dans le bloc-notes EMR contenant une balise de paramètres. Cette cellule permet à un script de transmettre de nouvelles valeurs d'entrée au bloc-notes. Les blocs-notes paramétrés peuvent être réutilisés avec différents ensembles de valeurs d'entrée. Il n'est pas nécessaire de faire des copies du même bloc-notes pour le modifier et l'exécuter avec de nouvelles valeurs d'entrée. Amazon EMR crée et enregistre le bloc-notes résultant sur S3 pour chaque exécution du bloc-notes paramétré. Pour des exemples de code d'API de bloc-notes EMR, consultez [Exemples de commandes programmatiques pour les notebooks EMR](emr-managed-notebooks-headless.md).

**Important**  
La fonctionnalité de blocs-notes EMR prend en charge les clusters qui utilisent les versions 5.18.0 et supérieures d'Amazon EMR. Nous vous recommandons d'utiliser les blocs-notes EMR avec des clusters qui utilisent la dernière version d'Amazon EMR, ou au moins 5.30.0, 5.32.0 ou 6.2.0. Avec ces versions, les noyaux Jupyter s'exécutent sur le cluster attaché plutôt que sur une instance Jupyter. Cela améliore les performances et votre capacité à personnaliser les noyaux et les bibliothèques. Pour de plus amples informations, veuillez consulter [Différences de capacités en fonction de la version du cluster](emr-managed-notebooks-considerations.md#considerations-cluster-version).

Les frais afférents au stockage Amazon S3 et aux clusters Amazon EMR s'appliquent.

# Les notebooks Amazon EMR sont disponibles sous forme d'espaces de travail Amazon EMR Studio dans la console
<a name="emr-managed-notebooks-migration"></a>

## Transition des blocs-notes EMR vers les espaces de travail
<a name="emr-notebooks-workspaces-transition"></a>

Dans la [nouvelle console Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html), nous avons fusionné les blocs-notes EMR et les espaces de travail Amazon EMR Studio en une seule expérience. Lorsque vous utilisez un studio EMR, vous pouvez créer et configurer différents espaces de travail pour organiser et exécuter des blocs-notes. Si vous utilisiez des blocs-notes Amazon EMR dans l'ancienne console, ils sont disponibles sous forme d'espaces de travail EMR Studio dans la console.

Amazon EMR a créé ces nouveaux espaces de travail EMR Studio pour vous. Le nombre de studios que nous avons créés correspond au nombre de studios distincts VPCs que vous utilisez dans EMR Notebooks. Par exemple, si vous vous connectez à des clusters EMR dans deux environnements différents VPCs de ceux des Notebooks EMR, nous avons créé deux nouveaux studios EMR. Vos blocs-notes sont répartis entre les nouveaux studios. 

**Important**  
Nous avons désactivé l'option permettant de créer de nouveaux blocs-notes dans l'ancienne console Amazon EMR. Utilisez plutôt **Créer un espace de travail** dans la nouvelle console Amazon EMR.

Pour plus d'informations sur les espaces de travail Amazon EMR Studio, consultez [Découvrez les espaces de travail EMR Studio](emr-studio-configure-workspace.md). Pour une présentation conceptuelle d'EMR Studio, consultez [Espaces de travail](how-emr-studio-works.md#emr-studio-workspaces) sur la page [Comment fonctionne Amazon EMR Studio](how-emr-studio-works.md).

## Que devez-vous faire ?
<a name="emr-notebooks-workspaces-prepare"></a>

Bien que vous puissiez toujours utiliser vos blocs-notes existants dans l'ancienne console, nous vous recommandons d'utiliser plutôt les espaces de travail Amazon EMR Studio dans la console. Vous devez configurer des autorisations de rôle supplémentaires pour activer les [fonctionnalités d'EMR Studio qui ne sont pas disponibles dans les blocs-notes EMR](#emr-notebooks-workspaces-enhancements). 

**Note**  
Au minimum, pour visualiser les blocs-notes EMR existants en tant qu'espaces de travail EMR Studio et pour créer de nouveaux espaces de travail, les utilisateurs doivent disposer des autorisations `elasticmapreduce:ListStudios` et `elasticmapreduce:CreateStudioPresignedUrl` sur leurs rôles. Pour accéder à toutes les fonctionnalités d'EMR Studio, consultez [Activation des fonctionnalités d'EMR Studio pour les utilisateurs des blocs-notes EMR](#emr-notebooks-workspaces-enable) pour la liste complète des autorisations supplémentaires dont les utilisateurs des blocs-notes EMR auront besoin.

## Fonctionnalités améliorées d'EMR Studio au-delà des blocs-notes EMR
<a name="emr-notebooks-workspaces-enhancements"></a>

Grâce à Amazon EMR Studio, vous pouvez configurer et utiliser les fonctionnalités suivantes, qui ne sont pas disponibles avec les blocs-notes EMR :
+ [Navigation et attachement aux clusters EMR à partir de Jupyterlab](emr-studio-create-use-clusters.md)
+ [Navigation et attachement aux clusters virtuels des blocs-notes EMR à partir de Jupyterlab](emr-studio-create-use-clusters.md)
+ [Connexion aux dépôts Git depuis Jupyterlab](emr-studio-git-repo.md)
+ [Collaboration avec d'autres membres de votre équipe pour écrire et exécuter le code du bloc-notes](emr-studio-workspace-collaboration.md)
+ [Consultation des données à l'aide de SQL Explorer](emr-studio-sql-explorer.md)
+ [Provisionnement des clusters EMR avec Service Catalog](emr-studio-cluster-templates.md)

Pour une liste complète des fonctionnalités d'Amazon EMR Studio, consultez [Principales fonctionnalités d'EMR Studio](emr-studio.md#emr-studio-key-features). 

## Activation des fonctionnalités d'EMR Studio pour les utilisateurs des blocs-notes EMR
<a name="emr-notebooks-workspaces-enable"></a>

Les nouveaux studios EMR que nous allons créer dans le cadre de cette fusion utilisent le rôle IAM `EMR_Notebooks_DefaultRole` existant comme fonction du service EMR Studio.

Les utilisateurs qui font la transition des blocs-notes EMR vers EMR Studio et qui souhaitent utiliser les capacités supplémentaires d'EMR Studio ont besoin de plusieurs nouvelles autorisations de rôle. Ajoutez les autorisations suivantes aux rôles des utilisateurs de vos blocs-notes EMR qui prévoient d'utiliser EMR Studio.

**Note**  
Au minimum, pour visualiser les blocs-notes EMR existants en tant qu'espaces de travail EMR Studio et pour créer de nouveaux espaces de travail, les utilisateurs doivent disposer des autorisations `elasticmapreduce:ListStudios` et `elasticmapreduce:CreateStudioPresignedUrl` sur leurs rôles. Pour utiliser toutes les fonctionnalités d'EMR Studio, ajoutez toutes les autorisations répertoriées ci-dessous. Les utilisateurs administrateurs doivent également être autorisés à créer et à gérer un studio EMR. Pour de plus amples informations, veuillez consulter [Autorisations d'administrateur pour créer et gérer un EMR Studio](emr-studio-admin-permissions.md).

```
"elasticmapreduce:DescribeStudio", 
"elasticmapreduce:ListStudios",
"elasticmapreduce:CreateStudioPresignedUrl",
"elasticmapreduce:UpdateEditor", 
"elasticmapreduce:PutWorkspaceAccess", 
"elasticmapreduce:DeleteWorkspaceAccess", 
"elasticmapreduce:ListWorkspaceAccessIdentities",
"emr-containers:ListVirtualClusters", 
"emr-containers:DescribeVirtualCluster", 
"emr-containers:ListManagedEndpoints", 
"emr-containers:DescribeManagedEndpoint", 
"emr-containers:CreateAccessTokenForManagedEndpoint",
"emr-containers:ListJobRuns", 
"emr-containers:DescribeJobRun",
"servicecatalog:SearchProducts", 
"servicecatalog:DescribeProduct", 
"servicecatalog:DescribeProductView", 
"servicecatalog:DescribeProvisioningParameters", 
"servicecatalog:ProvisionProduct", 
"servicecatalog:UpdateProvisionedProduct", 
"servicecatalog:ListProvisioningArtifacts", 
"servicecatalog:DescribeRecord", 
"servicecatalog:ListLaunchPaths", 
"cloudformation:DescribeStackResources"
```

Les autorisations suivantes sont également nécessaires pour utiliser les fonctionnalités de collaboration d'EMR Studio, mais ne l'étaient pas pour les blocs-notes EMR.

```
"sso-directory:SearchUsers",
"iam:GetUser", 
"iam:GetRole", 
"iam:ListUsers", 
"iam:ListRoles", 
"sso:GetManagedApplicationInstance"
```

# Exigences, différences entre les versions et sécurité pour les EMR Notebooks
<a name="emr-managed-notebooks-considerations"></a>

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

Tenez compte des exigences suivantes, des différences entre les versions, des informations de sécurité et d'autres considérations lorsque vous créez des clusters et développez des solutions à l'aide du bloc-notes EMR.

## Exigences en matière de cluster
<a name="considerations-limitations"></a>
+ **Activer le blocage de l'accès public à Amazon EMR** – L'accès entrant à un cluster permet aux utilisateurs du cluster d'exécuter des noyaux de bloc-notes. Assurez-vous que seuls les utilisateurs autorisés peuvent accéder au cluster. Nous vous recommandons fortement de laisser l'accès public aux blocs activé et de limiter le trafic SSH entrant aux sources fiables uniquement. Pour plus d’informations, consultez [Utilisation du blocage de l'accès public Amazon EMR](emr-block-public-access.md) et [Contrôlez le trafic réseau avec des groupes de sécurité pour votre cluster Amazon EMR](emr-security-groups.md).
+ **Utiliser un cluster compatible** – Un cluster attaché à un bloc-notes doit répondre aux exigences suivantes :
  + Seuls les clusters créés à l'aide d'Amazon EMR sont pris en charge. Vous pouvez créer un cluster indépendamment à l'intérieur d'Amazon EMR, puis attacher un bloc-notes EMR, ou vous pouvez créer un cluster compatible lorsque vous créez un bloc-notes EMR.
  + Seuls les clusters créés à l'aide d'Amazon EMR en version 5.18.0 et ultérieure sont pris en charge. Consultez [Différences de capacités en fonction de la version du cluster](#considerations-cluster-version).
  + Les clusters créés à l'aide d'instances Amazon EC2 avec des processeurs AMD EPYC, par exemple, les types d'instances m5a.\$1 et r5a.\$1, ne sont pas pris en charge.
  + Les blocs-notes EMR ne fonctionnent qu'avec des clusters créés avec `VisibleToAllUsers` défini sur `true`. `VisibleToAllUsers` est `true` par défaut.
  + Le cluster doit être lancé dans un EC2-VPC. Les sous-réseaux publics et privés sont pris en charge. La plateforme EC2-Classic n'est pas prise en charge.
  + Le cluster doit être lancé avec Hadoop, Spark et Livy installés. D'autres applications peuvent être installées, mais les blocs-notes EMR ne prennent actuellement en charge que les clusters Spark.
**Important**  
Pour les versions 5.32.0 et ultérieures ou 6.2.0 et ultérieures d'Amazon EMR, votre cluster doit également exécuter l'application Jupyter Enterprise Gateway pour pouvoir utiliser les blocs-notes EMR.
  + Les clusters avec authentification Kerberos ne sont pas pris en charge.
  + Les clusters intégrés AWS Lake Formation prennent en charge l'installation de bibliothèques adaptées aux ordinateurs portables uniquement. L'installation des noyaux et des bibliothèques sur le cluster n'est pas prise en charge.
  + Les clusters avec plusieurs nœuds primaires ne sont pas pris en charge.
  + Les clusters utilisant des instances Amazon EC2 basées sur AWS Graviton2 ne sont pas pris en charge.

## Différences de capacités en fonction de la version du cluster
<a name="considerations-cluster-version"></a>

Nous vous recommandons vivement d'utiliser les blocs-notes EMR avec les clusters créés à l'aide des versions 5.30.0, 5.32.0 ou ultérieures, ou 6.2.0 ou ultérieures d'Amazon EMR. Avec ces versions, les blocs-notes EMR exécutent les noyaux sur le cluster Amazon EMR attaché. Les noyaux et les bibliothèques peuvent être installés directement sur le nœud primaire du cluster. L'utilisation des blocs-notes EMR avec ces versions de cluster présente les avantages suivants :
+ **Performances améliorées** – Les noyaux de bloc-notes s'exécutent sur des clusters avec les types d'instance EC2 que vous sélectionnez. Les versions antérieures exécutent des noyaux sur une instance spécialisée qui ne peut pas être redimensionnée, accessible ou personnalisée. 
+ **Possibilité d'ajouter et de personnaliser des noyaux** – Vous pouvez vous connecter au cluster pour installer des paquets de noyau en utilisant `conda` et `pip`. En outre, l'installation `pip` est prise en charge à l'aide de commandes de terminal dans les cellules de bloc-notes. Dans les versions précédentes, seuls les noyaux préinstallés étaient disponibles (Python PySpark, Spark et SparkR). Pour de plus amples informations, veuillez consulter [Installation des noyaux et des bibliothèques Python sur le nœud primaire d'un cluster](emr-managed-notebooks-installing-libraries-and-kernels.md#emr-managed-notebooks-cluster-kernel).
+ **Possibilité d'installer des bibliothèques Python** – Vous pouvez [installer des bibliothèques Python sur le nœud primaire du cluster](emr-managed-notebooks-installing-libraries-and-kernels.md#emr-managed-notebooks-cluster-kernel) en utilisant `conda` et `pip`. Nous vous recommandons d'utiliser `conda`. Dans les versions antérieures, seules les [bibliothèques adaptées aux ordinateurs portables sont prises en charge.](emr-managed-notebooks-installing-libraries-and-kernels.md#emr-managed-notebooks-custom-libraries-limitations) PySpark 


**Fonctionnalités des blocs-notes EMR prises en charge par la version du cluster**  

| Version de cluster | Bibliothèques adaptées aux ordinateurs portables pour PySpark | Installation du noyau sur le cluster | Installation de la bibliothèque Python sur le nœud primaire | 
| --- | --- | --- | --- | 
|  Antérieur à 5.18.0  |  Blocs-notes EMR non pris en charge  | 
|  5.18.0–5.25.0  |  Non  |  Non  |  Non  | 
|  5.26.0–5.29.0  |  [Oui](emr-managed-notebooks-installing-libraries-and-kernels.md#emr-managed-notebooks-custom-libraries-limitations)  |  Non  |  Non  | 
|  5.30.0  |  [Oui](emr-managed-notebooks-installing-libraries-and-kernels.md#emr-managed-notebooks-custom-libraries-limitations)  |  [Oui](emr-managed-notebooks-installing-libraries-and-kernels.md#emr-managed-notebooks-cluster-kernel)  |  [Oui](emr-managed-notebooks-installing-libraries-and-kernels.md#emr-managed-notebooks-cluster-kernel)  | 
|  6.0.0  |  Non  |  Non  |  Non  | 
| Version 5.32.0 et ultérieure, et version 6.2.0 et ultérieure | [Oui](emr-managed-notebooks-installing-libraries-and-kernels.md#emr-managed-notebooks-custom-libraries-limitations) | [Oui](emr-managed-notebooks-installing-libraries-and-kernels.md#emr-managed-notebooks-cluster-kernel) | [Oui](emr-managed-notebooks-installing-libraries-and-kernels.md#emr-managed-notebooks-cluster-kernel) | 

## Limites pour les blocs-notes EMR connectés simultanément
<a name="emr-managed-notebooks-cluster-limits"></a>

Prenez en compte le type d'instance EC2 du nœud primaire du cluster lorsque vous créez un cluster qui prend en charge les blocs-notes. Les contraintes de mémoire de cette instance EC2 déterminent le nombre de blocs-notes qui peuvent être prêts simultanément pour exécuter du code et des demandes sur le cluster.


| Type d'instance EC2 du nœud primaire | Nombre de blocs-notes EMR | 
| --- | --- | 
|  \$1.medium  |  2  | 
|  \$1.large  |  4  | 
|  \$1.xlarge  |  8  | 
|  \$1.2xlarge  |  16  | 
|  \$1.4xlarge  |  24  | 
|  \$1.8xlarge  |  24  | 
|  \$1.16xlarge  |  24  | 

## Versions de bloc-notes Jupyter et de Python
<a name="considerations-versions"></a>

Les blocs-notes EMR exécutent le [bloc-notes Jupyter en version 6.0.2](https://jupyter-notebook.readthedocs.io/en/stable/changelog.html#release-6-0-2) et Python en version 3.6.5, quelle que soit la version Amazon EMR du cluster attaché.

## Considérations relatives à la sécurité
<a name="considerations-notebooks-security"></a>

**Utiliser des emplacements S3 chiffrés**  
Si vous indiquez un emplacement chiffré dans Amazon S3 pour stocker les fichiers de bloc-notes, vous devez configurer le rôle [Rôle de service pour Blocs-notes EMR](emr-managed-notebooks-service-role.md) en tant qu'utilisateur de clé. Le rôle de service par défaut est `EMR_Notebooks_DefaultRole`. Si vous utilisez une AWS KMS clé pour le chiffrement, consultez la section [Utilisation des politiques relatives aux clés dans AWS KMS](https://docs.aws.amazon.com/kms/latest/developerguide/key-policies.html#key-policy-users-crypto) dans le manuel du AWS Key Management Service développeur et l'[article d'assistance relatif à l'ajout d'utilisateurs clés](https://aws.amazon.com/premiumsupport/knowledge-center/s3-bucket-access-default-encryption/).

**Utilisation de cookies dans les domaines d’hébergement**  
Pour renforcer la sécurité des applications hors console que vous pouvez utiliser avec Amazon EMR, les domaines hébergeant les applications sont enregistrés dans la liste des suffixes publics (PSL). Voici des exemples de ces domaines d’hébergement : `emrstudio-prod.us-east-1.amazonaws.com`, `emrnotebooks-prod.us-east-1.amazonaws.com`, `emrappui-prod.us-east-1.amazonaws.com`. Pour plus de sécurité, si vous avez besoin de définir des cookies sensibles dans le nom de domaine par défaut, nous vous recommandons d’utiliser des cookies avec un préfixe `__Host-`. Cela vous permettra de protéger votre domaine contre les tentatives de falsification de requêtes intersites (CSRF). Pour plus d’informations, voir la page [https://developer.mozilla.org/en-US/docs/Web/HTTP/Headers/Set-Cookie#cookie_prefixes](https://developer.mozilla.org/en-US/docs/Web/HTTP/Headers/Set-Cookie#cookie_prefixes) du *Mozilla Developer Network*. 

# Création d'un bloc-notes dans EMR Studio
<a name="emr-managed-notebooks-create"></a>

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

Créez un bloc-notes EMR à l'aide de l'ancienne console Amazon EMR. La création de blocs-notes à l'aide de l'API Amazon EMR AWS CLI ou de l'API Amazon EMR n'est pas prise en charge.

**Pour créer un bloc-notes EMR**

1. Ouvrez la console Amazon EMR à l'adresse [https://console.aws.amazon.com/elasticmapreduce/](https://console.aws.amazon.com/elasticmapreduce/).

1. Choisissez **Notebooks (Blocs-notes)**, **Create notebook (Créer bloc-notes)**.

1. Saisissez un nom **Notebook name (Nom de bloc-notes)** et une **Notebook description (Description de bloc-notes)** facultative.

1. Si vous disposez d'un cluster actif auquel vous souhaitez attacher le bloc-notes, laissez la valeur par défaut **Choisir un cluster existant** sélectionnée, cliquez sur **Choisir**, sélectionnez un cluster dans la liste, puis cliquez sur **Choisir un cluster**. Pour plus d'informations sur les exigences en matière de cluster pour les blocs-notes EMR, consultez [Exigences, différences entre les versions et sécurité pour les EMR Notebooks](emr-managed-notebooks-considerations.md).

   **—ou—**

   Choisissez **Créer un cluster**, entrez un **nom de cluster** et choisissez les options selon les instructions suivantes. Le cluster est créé dans le VPC par défaut pour le compte à l'aide d'instances à la demande.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/emr/latest/ManagementGuide/emr-managed-notebooks-create.html)

1. Pour **Security groups (Groupes de sécurité)**, choisissez **Use default security groups (Utiliser les groupes de sécurité par défaut)**. Vous pouvez également sélectionner **Choisir des groupes de sécurité** et sélectionner des groupes de sécurité personnalisés qui sont disponibles dans le VPC du cluster. Sélectionnez un pour l'instance principale et un autre pour l'instance client du bloc-notes. Pour de plus amples informations, veuillez consulter [Spécification des groupes de sécurité EC2 pour les blocs-notes EMR](emr-managed-notebooks-security-groups.md).

1. Pour la **fonction du service AWS **, laissez la valeur par défaut ou choisissez un rôle personnalisé dans la liste. L'instance client du bloc-notes utilise ce rôle. Pour de plus amples informations, veuillez consulter [Rôle de service pour Blocs-notes EMR](emr-managed-notebooks-service-role.md).

1. Pour l'**emplacement du bloc-notes**, choisissez l'emplacement dans Amazon S3 où le fichier du bloc-notes est enregistré, ou indiquez votre propre emplacement. Si le compartiment et le dossier n'existent pas, Amazon EMR le crée.

   Amazon EMR crée un dossier avec l'**identifiant du bloc-notes** comme nom de dossier, et enregistre le bloc-notes dans un fichier nommé `NotebookName.ipynb`. Par exemple, si vous indiquez l'emplacement `s3://amzn-s3-demo-bucket/MyNotebooks` dans Amazon S3 pour un bloc-notes nommé `MyFirstEMRManagedNotebook`, le fichier est enregistré sous `s3://amzn-s3-demo-bucket/MyNotebooks/NotebookID/MyFirstEMRManagedNotebook.ipynb`.

   Si vous indiquez un emplacement chiffré dans Amazon S3, vous devez configurer le rôle [Rôle de service pour Blocs-notes EMR](emr-managed-notebooks-service-role.md) en tant qu'utilisateur de clé. Le rôle de service par défaut est `EMR_Notebooks_DefaultRole`. Si vous utilisez une AWS KMS clé pour le chiffrement, consultez la section [Utilisation des politiques relatives aux clés dans AWS KMS](https://docs.aws.amazon.com/kms/latest/developerguide/key-policies.html#key-policy-users-crypto) dans le manuel du AWS Key Management Service développeur et l'[article d'assistance relatif à l'ajout d'utilisateurs clés](https://aws.amazon.com/premiumsupport/knowledge-center/s3-bucket-access-default-encryption/).

1. En option, si vous avez ajouté à Amazon EMR un référentiel basé sur Git que vous souhaitez l'associer à ce bloc-notes, choisissez **Référentiel Git**, sélectionnez **Choisir un référentiel**, puis sélectionnez un référentiel dans la liste. Pour de plus amples informations, veuillez consulter [– Association de référentiels Git à des blocs-notes EMR](emr-git-repo.md).

1. Le cas échéant, choisissez **Tags (Balises)**, puis ajoutez des balises clé-valeur supplémentaires pour le bloc-notes.
**Important**  
Une balise par défaut avec l'ensemble de chaîne de **Key (Clé)** définie sur `creatorUserID` et la valeur définie sur votre ID d'utilisateur IAM sont appliqués à des fins d'accès. Nous vous recommandons de ne pas modifier ou supprimer cette balise, car elle peut être utilisée pour contrôler l'accès. Pour de plus amples informations, veuillez consulter [Utiliser les balises de cluster et de bloc-notes avec des politiques IAM de contrôle d'accès](security_iam_service-with-iam.md#emr-tag-based-access).

1. Choisissez **Créer un bloc-notes**.

# Utilisation des blocs-notes EMR
<a name="emr-managed-notebooks-working-with"></a>

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

Après la création d'un bloc-notes EMR, le démarrage du bloc-notes prend peu de temps. Le **Status (Statut)** dans la liste **Blocs-notes** affiche **Démarrage**. Vous pouvez ouvrir un bloc-notes lorsqu'il est **Ready (Prêt)**. Un bloc-notes peut prendre un peu plus longtemps à être **Ready (Prêt)** si vous avez créé un cluster pour l'accompagner.

**Astuce**  
Actualisez votre navigateur ou choisissez l'icône d'actualisation au-dessus de la liste des blocs-notes pour actualiser le statut du bloc-notes.

## Compréhension de l'état du bloc-notes
<a name="emr-managed-notebooks-status"></a>

Le bloc-notes EMR peut avoir les **états** suivants dans la liste des **blocs-notes**.


| Statut | Signification | 
| --- | --- | 
|  Prêt  |  Vous pouvez ouvrir le bloc-notes à l'aide de l'éditeur de bloc-notes. Vous pouvez arrêter ou supprimer un bloc-notes, même s'il affiche un statut de **Ready (Prêt)**. Vous devez d'abord arrêter le bloc-notes pour modifier les clusters. Si un bloc-notes avec un statut de **Ready (Prêt)** est inactif pendant une longue période de temps, il est automatiquement arrêté.  | 
|  Démarrage en cours  |  Le bloc-notes est en cours d'être créé et joint au cluster. Lorsqu'un bloc-notes est en cours de démarrage, vous ne pouvez pas supprimer l'éditeur de bloc-notes, l'arrêter, le supprimer ou modifier les clusters.  | 
|  En attente  |  Le bloc-notes a été créé et est en attente d'intégration avec le cluster pour terminer. Il se peut que le cluster soit toujours en train de mettre en service des ressources ou de répondre à d'autres demandes. Vous pouvez ouvrir l'éditeur de bloc-notes avec le bloc-notes en *mode local*. Tout code qui s'appuie sur les processus de cluster n'est pas exécuté et échoue.  | 
|  Arrêt en cours  |  Le bloc-notes est en cours d'arrêt ou le cluster auquel le bloc-notes est attaché est en cours d'arrêt. Lorsqu'un bloc-notes est en cours d'arrêt, vous ne pouvez pas supprimer l'éditeur de bloc-notes, l'arrêter, le supprimer ou modifier les clusters.  | 
|  Arrêté(e)  |  Le bloc-notes s'est arrêté. Vous pouvez démarrer le bloc-notes sur le même cluster, tant que le cluster est encore en cours d'exécution. Vous pouvez changer de clusters et supprimer le cluster.  | 
|  Suppression  |  Le cluster est en cours de suppression de la liste des clusters disponibles. Le fichier de bloc-notes `NotebookName.ipynb ` reste dans Amazon S3 et continue à accumuler des frais de stockage applicables.  | 

## Utilisation de l'éditeur de bloc-notes
<a name="emr-managed-notebooks-editor"></a>

L'un des avantages de l'utilisation d'un bloc-notes EMR est que vous pouvez lancer le bloc-notes dans Jupyter ou JupyterLab directement depuis la console.

Avec EMR Notebooks, l'éditeur de bloc-notes auquel vous accédez depuis la console Amazon EMR est l'éditeur open source Jupyter Notebooks ou. JupyterLab L'éditeur de bloc-notes étant lancé dans la console Amazon EMR, il est plus efficace de configurer l'accès qu'avec un bloc-notes hébergé sur un cluster Amazon EMR. Vous n'avez pas besoin de configurer un client de l'utilisateur pour l'accès web via SSH, les règles du groupe de sécurité et les configurations de proxy. Si un utilisateur dispose d'autorisations suffisantes, il lui suffit d'ouvrir l'éditeur de bloc-notes dans la console Amazon EMR.

Seul un utilisateur à la fois peut avoir un bloc-notes EMR ouvert à partir d'Amazon EMR. Une erreur se produit si un autre utilisateur essaie d'ouvrir un bloc-notes EMR qui est déjà ouvert.

**Important**  
Amazon EMR crée une URL pré-signée unique pour chaque session de l'éditeur de bloc-notes, qui n'est valable que pour une courte durée. Nous vous recommandons de ne pas partager l'URL d'éditeur de bloc-notes. Cela créerai un risque de sécurité, car les destinataires de l'URL adoptent vos autorisations à modifier le bloc-notes et à exécuter le code de bloc-notes pour toute la durée de vie de l'URL. Si d'autres personnes ont besoin d'accéder à un bloc-notes, accordez des autorisations à leur utilisateur via des politiques d'autorisation et assurez-vous que la fonction de service associée aux blocs-notes EMR a accès à l'emplacement Amazon S3. Pour plus d’informations, consultez [Sécurité et contrôle d'accès des blocs-notes EMR](emr-managed-notebooks-security.md) et [Rôle de service pour Blocs-notes EMR](emr-managed-notebooks-service-role.md).

**Ouverture de l'éditeur de bloc-notes pour un bloc-notes EMR**

1. Sélectionnez un bloc-notes avec un **Status (Statut)** de **Ready (Prêt)** ou **Pending (En attente)** à partir de la liste **Notebooks (Blocs-notes)**.

1. Choisissez **Ouvrir dans JupyterLab** ou **Ouvrir dans Jupyter**.

   Un nouvel onglet de navigateur s'ouvre dans l'éditeur JupyterLab Jupyter Notebook.

1. Depuis le menu **Kernel (Noyau)**, choisissez **Change kernel (Changer de noyau)** puis sélectionnez le noyau pour votre langage de programmation.

   Vous êtes maintenant prêt à écrire et exécuter du code à partir de l'éditeur de bloc-notes.

### Enregistrement du contenu d'un bloc-notes
<a name="emr-managed-notebooks-saving"></a>

Lorsque vous travaillez dans l'éditeur de bloc-notes, le contenu des cellules du bloc-notes et les résultats sont enregistrés automatiquement dans le fichier du bloc-notes et périodiquement sur Amazon S3. Un bloc-notes dans lequel aucune modification n'a été apportée depuis la dernière fois qu'une cellule a été modifiée affiche **(autosaved) (enregistré automatiquement)** à côté du nom de bloc-notes dans l'éditeur. Si des modifications n'ont pas encore été enregistrées, **unsaved changes (modifications non enregistrées)** s'affiche.

Vous pouvez manuellement enregistrer un bloc-notes. Dans le menu **Fichier**, choisissez **Enregistrer et point de contrôle** ou appuyez sur CTRL\$1S. Cela crée un fichier nommé `NotebookName.ipynb` dans un dossier de **points de contrôle** au sein du dossier de bloc-notes d'Amazon S3. Par exemple, `s3://amzn-s3-demo-bucket/MyNotebookFolder/NotebookID/checkpoints/NotebookName.ipynb`. Seul le dernier fichier de point de contrôle est enregistré dans cet emplacement.

## Modification des clusters
<a name="emr-managed-notebooks-changing-clusters"></a>

Vous pouvez modifier le cluster auquel un bloc-notes EMR est attaché sans modifier le contenu du bloc-notes lui-même. Vous pouvez modifier les clusters pour les seuls blocs-notes qui ont un état **Stopped (Arrêté)**.

**Modification du cluster d'un bloc-notes EMR**

1. Si le bloc-notes que vous souhaitez modifier est en cours d'exécution, sélectionnez-le dans la liste **Notebooks (Blocs-notes)** et choisissez **Arrêter**.

1. Lorsque l'état de bloc-notes est **Stopped (Arrêté)**, sélectionnez le bloc-notes dans la liste **Notebooks (Blocs-notes)**, puis choisissez **View details (Afficher les détails)**.

1. Choisissez **Change cluster (Changer de cluster)**.

1. Si vous disposez d'un cluster actif exécutant Hadoop, Spark et Livy auquel vous souhaitez associer le bloc-notes, conservez la valeur par défaut et sélectionnez un cluster dans la liste. Seuls les clusters qui répondent aux exigences sont répertoriés.

   —ou—

   Choisissez **Create a cluster (Créer un cluster)**, puis choisissez les options de cluster. Pour de plus amples informations, veuillez consulter [Exigences en matière de cluster](emr-managed-notebooks-considerations.md#considerations-limitations).

1. Choisissez une option pour les **Security groups (Groupes de sécurité)**, puis choisissez **Modifier le cluster et démarrez le bloc-notes**.

## Suppression des blocs-notes et des fichiers de bloc-notes
<a name="emr-managed-notebooks-deleting"></a>

Lorsque vous supprimez un bloc-notes EMR aide de la console Amazon EMR, vous devez supprimer le bloc-notes à partir de la liste des blocs-notes disponibles. Cependant, les fichiers de bloc-notes restent dans Amazon S3 et continuent d'accumuler des frais de stockage.

**Pour supprimer un bloc-notes et retirer les fichiers associés**

1. Ouvrez la console Amazon EMR à l'adresse [https://console.aws.amazon.com/elasticmapreduce/](https://console.aws.amazon.com/elasticmapreduce/).

1. Choisissez **Notebooks (Blocs-notes)**, sélectionnez votre bloc-notes dans la liste, puis choisissez **View details (Afficher les détails)**.

1. Choisissez l'icône de dossier à côté de **Notebook location (Emplacement de bloc-notes)** et copiez l'**URL** qui se trouve dans le modèle `s3://MyNotebookLocationPath/NotebookID/`.

1. Sélectionnez **Delete (Supprimer)**.

   Le bloc-notes est supprimé de la liste et les détails de bloc-notes ne peuvent plus être consultés.

1. Suivez les instructions de la rubrique [Comment supprimer des dossiers d'un compartiment S3 ?](https://docs.aws.amazon.com/AmazonS3/latest/userguide/delete-folders.html) dans le Guide de l'utilisateur d'Amazon Simple Storage Service. Naviguez vers le compartiment et le dossier de l'étape 3.

   —ou—

   Si vous l'avez AWS CLI installé, ouvrez une invite de commande et tapez la commande à la fin de ce paragraphe. Remplacez l'emplacement Amazon S3 par l'emplacement que vous avez copié ci-dessus. Assurez-vous que le AWS CLI est configuré avec les clés d'accès d'un utilisateur autorisé à supprimer l'emplacement Amazon S3. Pour plus d'informations, veuillez consulter [configuration de l'outil AWS CLI](https://docs.aws.amazon.com/AmazonS3/latest/userguide/cli-chap-getting-started.html) dans le *guide de l'utilisateur de l'outil AWS Command Line Interface *.

   ```
   aws s3 rm s3://MyNotebookLocationPath/NotebookID
   ```

## Partage de fichiers de bloc-notes
<a name="emr-managed-notebooks-file-sharing"></a>

Chaque bloc-notes EMR est enregistré sur Amazon S3 sous la forme d'un fichier nommé `NotebookName.ipynb`. Tant qu'un fichier de bloc-notes est compatible avec la même version de bloc-notes Jupyter que celle sur laquelle repose le bloc-notes EMR, vous pouvez ouvrir le bloc-notes en tant que bloc-notes EMR.

Le moyen le plus simple d'ouvrir un fichier bloc-notes d'un autre utilisateur consiste à enregistrer le fichier\$1.ipynb d'un autre utilisateur sur votre système de fichiers local, puis à utiliser la fonction de téléchargement dans Jupyter et les éditeurs. JupyterLab 

Vous pouvez utiliser cette procédure pour utiliser les blocs-notes EMR partagés par d'autres, des blocs-notes Jupyter partagés dans la communauté, ou pour restaurer un bloc-notes qui a été supprimé de la console lorsque vous disposez encore du fichier bloc-notes.

**Utilisation d'un autre fichier de bloc-notes comme base d'un bloc-notes EMR**

1. Avant de poursuivre, fermez l'éditeur de bloc-notes pour tous les blocs-notes que vous utilisez, puis arrêtez le bloc-notes s'il s'agit d'un bloc-notes EMR.

1. Créez un bloc-notes EMR et donnez-lui un nom. Le nom que vous saisissez pour le bloc-notes sera le nom du fichier que vous devez remplacer. Le nouveau nom de fichier doit correspondre exactement au nom de ce fichier.

1. Notez l'emplacement dans Amazon S3 que vous avez choisi pour le bloc-notes. Le fichier que vous remplacez est dans un dossier avec un chemin d'accès et un nom de fichier comme le modèle suivant : `s3://MyNotebookLocation/NotebookID/MyNotebookName.ipynb`.

1. Arrêtez le bloc-notes.

1. Remplacez l'ancien fichier de bloc-notes dans l'emplacement Amazon S3 par le nouveau, en utilisant exactement le même nom.

   La AWS CLI commande suivante pour Amazon S3 remplace un fichier enregistré sur une machine locale appelée `SharedNotebook.ipynb` pour un bloc-notes EMR avec le nom **MyNotebook**`e-12A3BCDEFJHIJKLMNO45PQRST`, l'identifiant et créé avec les informations `amzn-s3-demo-bucket/MyNotebooksFolder` spécifiées dans Amazon S3. Pour plus d'informations sur l'utilisation de la console Amazon S3 pour copier et remplacer des fichiers, consultez la rubrique [Chargement, téléchargement et gestion d'objets](https://docs.aws.amazon.com/AmazonS3/latest/userguide/upload-download-objects.html) dans le *Guide de l'utilisateur d'Amazon Simple Storage Service*.

   ```
   aws s3 cp SharedNotebook.ipynb s3://amzn-s3-demo-bucket/MyNotebooksFolder/-12A3BCDEFJHIJKLMNO45PQRST/MyNotebook.ipynb
   ```

# Exemples de commandes programmatiques pour les notebooks EMR
<a name="emr-managed-notebooks-headless"></a>

## Présentation de
<a name="emr-managed-notebooks-headless-overview"></a>

Vous pouvez exécuter des blocs-notes EMR à APIs partir d'un script ou d'une ligne de commande. Lorsque vous démarrez, arrêtez, listez et décrivez des exécutions de blocs-notes EMR en dehors de la AWS console, vous pouvez contrôler un bloc-notes EMR par programme. Vous pouvez transmettre différentes valeurs de paramètres à un bloc-notes avec une cellule de bloc-notes paramétrée. Il n'est donc plus nécessaire de créer une copie du bloc-notes pour chaque nouvel ensemble de valeurs de paramètres. Pour plus d'informations, consultez la rubrique [Actions de l'API Amazon EMR](https://docs.aws.amazon.com/emr/latest/APIReference/API_Operations.html).

Vous pouvez planifier ou regrouper les exécutions de blocs-notes EMR avec Amazon CloudWatch Events et. AWS Lambda Pour plus d'informations, consultez [Utilisation AWS Lambda avec Amazon CloudWatch Events](https://docs.aws.amazon.com/lambda/latest/dg/services-cloudwatchevents.html).

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

## Autorisations de rôle pour l'exécution par programmation
<a name="emr-managed-notebooks-headless-permissions"></a>

Pour utiliser l'exécution par programmation avec les blocs-notes EMR, vous devez configurer les autorisations des utilisateurs avec les politiques suivantes :

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Sid": "AllowExecutionActions",
      "Effect": "Allow",
      "Action": [
        "elasticmapreduce:StartNotebookExecution",
        "elasticmapreduce:DescribeNotebookExecution",
        "elasticmapreduce:ListNotebookExecutions"
      ],
      "Resource": [
        "*"
      ]
    },
    {
      "Sid": "AllowPassingServiceRole",
      "Effect": "Allow",
      "Action": [
        "iam:PassRole"
      ],
      "Resource": [
        "arn:aws:iam::123456789012:role/EMR_Notebooks_DefaultRole"
      ]
    }
  ]
}
```

------

Lorsque vous exécutez par programmation des blocs-notes EMR sur un cluster de blocs-notes EMR, vous devez ajouter ces autorisations supplémentaires :

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Sid": "AllowRetrievingManagedEndpointCredentials",
      "Effect": "Allow",
      "Action": [
        "emr-containers:GetManagedEndpointSessionCredentials"
      ],
      "Resource": [
        "arn:aws:emr-containers:*:123456789012:/virtualclusters/virtual-cluster-id/endpoints/managed-endpoint-id"
      ],
      "Condition": {
        "StringEquals": {
          "emr-containers:ExecutionRoleArn": [
            "arn:aws:iam::123456789012:role/emr-on-eks-execution-role"
          ]
        }
      }
    },
    {
      "Sid": "AllowDescribingManagedEndpoint",
      "Effect": "Allow",
      "Action": [
        "emr-containers:DescribeManagedEndpoint"
      ],
      "Resource": [
        "arn:aws:emr-containers:*:123456789012:/virtualclusters/virtual-cluster-id/endpoints/managed-endpoint-id"
      ]
    }
  ]
}
```

------

## Limites de l'exécution par programmation
<a name="emr-managed-notebooks-headless-limit"></a>
+ Un maximum de 100 exécutions simultanées sont prises en charge Région AWS par compte.
+ Une exécution est terminée si elle dure plus de 30 jours.
+ L'exécution par programmation des blocs-notes n'est pas prise en charge par les applications interactives Amazon EMR sans serveur.

## Exemples d'exécution par programmation d'un bloc-notes EMR
<a name="emr-managed-notebooks-headless-examples"></a>

Les sections suivantes fournissent plusieurs exemples d'exécution programmatique d'un bloc-notes EMR avec AWS CLI le SDK Boto3 (Python) et Ruby :
+ [Exemples de commandes CLI pour ordinateur portable dans EMR Studio](emr-managed-notebooks-headless-cli.md)
+ [Exemples de Python pour un bloc-notes EMR](emr-managed-notebooks-headless-python.md)
+ [Exemples de rubis pour un bloc-notes EMR](emr-managed-notebooks-headless-ruby.md)

Vous pouvez également exécuter des blocs-notes paramétrés dans le cadre de flux de travail planifiés à l'aide d'un outil d'orchestration tel qu'Apache Airflow ou Amazon Managed Workflows for Apache Airflow (MWAA). *Pour plus d'informations, consultez la rubrique [Orchestration des tâches d'analyse sur les blocs-notes EMR à l'aide de MWAA](https://aws.amazon.com/blogs/big-data/orchestrating-analytics-jobs-on-amazon-emr-notebooks-using-amazon-mwaa/) sur le blog AWS Big Data*.

# Exemples de commandes CLI pour ordinateur portable dans EMR Studio
<a name="emr-managed-notebooks-headless-cli"></a>

Cette rubrique présente des exemples de commandes CLI pour un bloc-notes EMR. L'exemple utilise le bloc-notes de démonstration de la console EMR Notebooks. Pour localiser le bloc-notes, utilisez le chemin relatif du fichier à partir du répertoire de base. Dans cet exemple, vous pouvez exécuter deux fichiers de bloc-notes : `demo_pyspark.ipynb` et`my_folder/python3.ipynb`. 

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

Le chemin relatif du fichier `demo_pyspark.ipynb` est `demo_pyspark.ipynb`, comme indiqué ci-dessous.

![\[Jupyter notebook interface showing a file explorer and code editor with PySpark content.\]](http://docs.aws.amazon.com/fr_fr/emr/latest/ManagementGuide/images/notebook_exe_folder_structure_1.png)


Le chemin relatif pour `python3.ipynb` est `my_folder/python3.ipynb`, comme indiqué ci-dessous.

![\[File explorer showing python3.ipynb in my_folder, and Jupyter notebook interface with code.\]](http://docs.aws.amazon.com/fr_fr/emr/latest/ManagementGuide/images/notebook_exe_folder_structure_2.png)


Pour plus d'informations sur les actions `NotebookExecution` de l'API Amazon EMR, consultez la rubrique [Actions de l'API Amazon EMR](https://docs.aws.amazon.com/emr/latest/APIReference/API_Operations.html).

## Exécution d'un bloc-notes
<a name="emr-managed-notebooks-api-actions"></a>

Vous pouvez utiliser le AWS CLI pour exécuter votre bloc-notes avec l'`start-notebook-execution`action, comme le montrent les exemples suivants. 

**Example – Exécution d'un bloc-notes EMR dans un espace de travail EMR Studio avec un cluster Amazon EMR (fonctionnant sur Amazon EC2)**  

```
aws emr --region us-east-1 \
start-notebook-execution \
--editor-id e-ABCDEFG123456 \
--notebook-params '{"input_param":"my-value", "good_superhero":["superman", "batman"]}' \
--relative-path test.ipynb \
--notebook-execution-name my-execution \
--execution-engine '{"Id" : "j-1234ABCD123"}' \
--service-role EMR_Notebooks_DefaultRole 
 
{
    "NotebookExecutionId": "ex-ABCDEFGHIJ1234ABCD"
}
```

**Example – Exécution d'un bloc-notes EMR dans un espace de travail EMR Studio avec un cluster de bloc-notes EMR**  

```
aws emr start-notebook-execution \
    --region us-east-1 \
    --service-role EMR_Notebooks_DefaultRole \
    --environment-variables '{"KERNEL_EXTRA_SPARK_OPTS": "--conf spark.executor.instances=1", "KERNEL_LAUNCH_TIMEOUT": "350"}' \
    --output-notebook-format HTML \
    --execution-engine Id=arn:aws:emr-containers:us-west-2:account-id:/virtualclusters/ABCDEFG/endpoints/ABCDEF,Type=EMR_ON_EKS,ExecutionRoleArn=arn:aws:iam::account-id:role/execution-role \
    --editor-id e-ABCDEFG \
    --relative-path EMRonEKS-spark_python.ipynb
```

**Example – Exécution d'un bloc-notes EMR en spécifiant son emplacement Amazon S3**  

```
aws emr start-notebook-execution \
    --region us-east-1 \
    --notebook-execution-name my-execution-on-emr-on-eks-cluster \
    --service-role EMR_Notebooks_DefaultRole \
    --environment-variables '{"KERNEL_EXTRA_SPARK_OPTS": "--conf spark.executor.instances=1", "KERNEL_LAUNCH_TIMEOUT": "350"}' \
    --output-notebook-format HTML \
    --execution-engine Id=arn:aws:emr-containers:us-west-2:account-id:/virtualclusters/ABCDEF/endpoints/ABCDEF,Type=EMR_ON_EKS,ExecutionRoleArn=arn:aws:iam::account-id:role/execution-role \
    --notebook-s3-location '{"Bucket": "amzn-s3-demo-bucket","Key": "s3-prefix-to-notebook-location/EMRonEKS-spark_python.ipynb"}' \
    --output-notebook-s3-location '{"Bucket": "amzn-s3-demo-bucket","Key": "s3-prefix-for-storing-output-notebook"}'
```

## Sortie de bloc-note
<a name="emr-managed-notebooks-headless-cli-output"></a>

 Voici le résultat d'un exemple de bloc-notes. La cellule 3 indique les valeurs des paramètres nouvellement injectés.

![\[Jupyter notebook cells showing Python code and output for parameter injection and manipulation.\]](http://docs.aws.amazon.com/fr_fr/emr/latest/ManagementGuide/images/HelloWorld_notebook.png)


## Décrire un bloc-notes
<a name="emr-managed-notebooks-headless-cli-describe"></a>

Vous pouvez utiliser l'action `describe-notebook-execution` pour accéder aux informations relatives à l'exécution d'un bloc-notes spécifique.

```
aws emr --region us-east-1 \
describe-notebook-execution --notebook-execution-id ex-IZWZZVR9DKQ9WQ7VZWXJZR29UGHTE
 
{
    "NotebookExecution": {
        "NotebookExecutionId": "ex-IZWZZVR9DKQ9WQ7VZWXJZR29UGHTE",
        "EditorId": "e-BKTM2DIHXBEDRU44ANWRKIU8N",
        "ExecutionEngine": {
            "Id": "j-2QMOV6JAX1TS2",
            "Type": "EMR",
            "MasterInstanceSecurityGroupId": "sg-05ce12e58cd4f715e"
        },
        "NotebookExecutionName": "my-execution",
        "NotebookParams": "{\"input_param\":\"my-value\", \"good_superhero\":[\"superman\", \"batman\"]}",
        "Status": "FINISHED",
        "StartTime": 1593490857.009,
        "Arn": "arn:aws:elasticmapreduce:us-east-1:123456789012:notebook-execution/ex-IZWZZVR9DKQ9WQ7VZWXJZR29UGHTE",
        "LastStateChangeReason": "Execution is finished for cluster j-2QMOV6JAX1TS2.",
        "NotebookInstanceSecurityGroupId": "sg-0683b0a39966d4a6a",
        "Tags": []
    }
}
```

## Arrêter un bloc-notes
<a name="emr-managed-notebooks-headless-cli-stop"></a>

Si votre bloc-notes exécute une exécution que vous souhaitez arrêter, vous pouvez le faire à l'aide de la commande `stop-notebook-execution`.

```
# stop a running execution
aws emr --region us-east-1 \
stop-notebook-execution --notebook-execution-id ex-IZWZX78UVPAATC8LHJR129B1RBN4T
 
 
# describe it
aws emr --region us-east-1 \
describe-notebook-execution --notebook-execution-id ex-IZWZX78UVPAATC8LHJR129B1RBN4T
 
{
    "NotebookExecution": {
        "NotebookExecutionId": "ex-IZWZX78UVPAATC8LHJR129B1RBN4T",
        "EditorId": "e-BKTM2DIHXBEDRU44ANWRKIU8N",
        "ExecutionEngine": {
            "Id": "j-2QMOV6JAX1TS2",
            "Type": "EMR"
        },
        "NotebookExecutionName": "my-execution",
        "NotebookParams": "{\"input_param\":\"my-value\", \"good_superhero\":[\"superman\", \"batman\"]}",
        "Status": "STOPPED",
        "StartTime": 1593490876.241,
        "Arn": "arn:aws:elasticmapreduce:us-east-1:123456789012:editor-execution/ex-IZWZX78UVPAATC8LHJR129B1RBN4T",
        "LastStateChangeReason": "Execution is stopped for cluster j-2QMOV6JAX1TS2. Internal error",
        "Tags": []
    }
}
```

## Répertorier les exécutions d'un bloc-notes par heure de début
<a name="emr-managed-notebooks-headless-cli-list"></a>

Vous pouvez passer un paramètre `--from` à `list-notebook-executions` pour répertorier les exécutions de votre bloc-notes par heure de début.

```
# filter by start time 
aws emr --region us-east-1 \ 
list-notebook-executions --from 1593400000.000
 
{
    "NotebookExecutions": [
        {
            "NotebookExecutionId": "ex-IZWZX78UVPAATC8LHJR129B1RBN4T",
            "EditorId": "e-BKTM2DIHXBEDRU44ANWRKIU8N",
            "NotebookExecutionName": "my-execution",
            "Status": "STOPPED",
            "StartTime": 1593490876.241
        },
        {
            "NotebookExecutionId": "ex-IZWZZVR9DKQ9WQ7VZWXJZR29UGHTE",
            "EditorId": "e-BKTM2DIHXBEDRU44ANWRKIU8N",
            "NotebookExecutionName": "my-execution",
            "Status": "RUNNING",
            "StartTime": 1593490857.009
        },
        {
            "NotebookExecutionId": "ex-IZWZYRS0M14L5V95WZ9OQ399SKMNW",
            "EditorId": "e-BKTM2DIHXBEDRU44ANWRKIU8N",
            "NotebookExecutionName": "my-execution",
            "Status": "STOPPED",
            "StartTime": 1593490292.995
        },
        {
            "NotebookExecutionId": "ex-IZX009ZK83IVY5E33VH8MDMELVK8K",
            "EditorId": "e-BKTM2DIHXBEDRU44ANWRKIU8N",
            "NotebookExecutionName": "my-execution",
            "Status": "FINISHED",
            "StartTime": 1593489834.765
        },
        {
            "NotebookExecutionId": "ex-IZWZXOZF88JWDF9J09GJ91R57VI0N",
            "EditorId": "e-BKTM2DIHXBEDRU44ANWRKIU8N",
            "NotebookExecutionName": "my-execution",
            "Status": "FAILED",
            "StartTime": 1593488934.688
        }
    ]
}
```

## Répertorier les exécutions d'un bloc-notes par heure de début et par état
<a name="emr-managed-notebooks-headless-cli-list"></a>

La commande `list-notebook-executions` peut également utiliser un paramètre `--status` pour filtrer les résultats.

```
# filter by start time and status 
aws emr --region us-east-1 \                 
list-notebook-executions --from 1593400000.000 --status FINISHED
{
    "NotebookExecutions": [
        {
            "NotebookExecutionId": "ex-IZWZZVR9DKQ9WQ7VZWXJZR29UGHTE",
            "EditorId": "e-BKTM2DIHXBEDRU44ANWRKIU8N",
            "NotebookExecutionName": "my-execution",
            "Status": "FINISHED",
            "StartTime": 1593490857.009
        },
        {
            "NotebookExecutionId": "ex-IZX009ZK83IVY5E33VH8MDMELVK8K",
            "EditorId": "e-BKTM2DIHXBEDRU44ANWRKIU8N",
            "NotebookExecutionName": "my-execution",
            "Status": "FINISHED",
            "StartTime": 1593489834.765
        }
    ]
}
```

# Exemples de Python pour un bloc-notes EMR
<a name="emr-managed-notebooks-headless-python"></a>

Cette rubrique contient un exemple de fichier de commandes. L'exemple de code est un fichier SDK pour Python (Boto3) appelé. `demo.py` Il montre l'exécution du bloc-notes APIs.

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

Pour plus d'informations sur les actions `NotebookExecution` de l'API Amazon EMR, consultez la rubrique [Actions de l'API Amazon EMR](https://docs.aws.amazon.com/emr/latest/APIReference/API_Operations.html).

```
import boto3,time

emr = boto3.client(
    'emr',
    region_name='us-west-1'
)     
     
start_resp = emr.start_notebook_execution(
    EditorId='e-40AC8ZO6EGGCPJ4DLO48KGGGI',
    RelativePath='boto3_demo.ipynb',
    ExecutionEngine={'Id':'j-1HYZS6JQKV11Q'},
    ServiceRole='EMR_Notebooks_DefaultRole'
)

execution_id = start_resp["NotebookExecutionId"]
print(execution_id)
print("\n")
     
describe_response = emr.describe_notebook_execution(NotebookExecutionId=execution_id)
     
print(describe_response)
print("\n")
     
list_response = emr.list_notebook_executions()
print("Existing notebook executions:\n")
for execution in list_response['NotebookExecutions']:
    print(execution)
    print("\n")  
     
print("Sleeping for 5 sec...")
time.sleep(5)
     
print("Stop execution " + execution_id)
emr.stop_notebook_execution(NotebookExecutionId=execution_id)
describe_response = emr.describe_notebook_execution(NotebookExecutionId=execution_id)
print(describe_response)
print("\n")
```

Voici le résultat de l'exécution `demo.py`.

```
ex-IZX56YJDW1D29Q1PHR32WABU2SAPK
     
{'NotebookExecution': {'NotebookExecutionId': 'ex-IZX56YJDW1D29Q1PHR32WABU2SAPK', 'EditorId': 'e-40AC8ZO6EGGCPJ4DLO48KGGGI', 'ExecutionEngine': {'Id': 'j-1HYZS6JQKV11Q', 'Type': 'EMR'}, 'NotebookExecutionName': '', 'Status': 'STARTING', 'StartTime': datetime.datetime(2020, 8, 19, 0, 49, 19, 418000, tzinfo=tzlocal()), 'Arn': 'arn:aws:elasticmapreduce:us-west-1:123456789012:notebook-execution/ex-IZX56YJDW1D29Q1PHR32WABU2SAPK', 'LastStateChangeReason': 'Execution is starting for cluster j-1HYZS6JQKV11Q.', 'Tags': []}, 'ResponseMetadata': {'RequestId': '70f12c5f-1dda-45b7-adf6-964987d373b7', 'HTTPStatusCode': 200, 'HTTPHeaders': {'x-amzn-requestid': '70f12c5f-1dda-45b7-adf6-964987d373b7', 'content-type': 'application/x-amz-json-1.1', 'content-length': '448', 'date': 'Wed, 19 Aug 2020 00:49:22 GMT'}, 'RetryAttempts': 0}}
     
Existing notebook executions:
     
{'NotebookExecutionId': 'ex-IZX56YJDW1D29Q1PHR32WABU2SAPK', 'EditorId': 'e-40AC8ZO6EGGCPJ4DLO48KGGGI', 'NotebookExecutionName': '', 'Status': 'STARTING', 'StartTime': datetime.datetime(2020, 8, 19, 0, 49, 19, 418000, tzinfo=tzlocal())}
     
     
{'NotebookExecutionId': 'ex-IZX5ABS5PR1E5AHMFYEMX3JJIORRB', 'EditorId': 'e-40AC8ZO6EGGCPJ4DLO48KGGGI', 'NotebookExecutionName': '', 'Status': 'RUNNING', 'StartTime': datetime.datetime(2020, 8, 19, 0, 48, 36, 373000, tzinfo=tzlocal())}
     
     
{'NotebookExecutionId': 'ex-IZX5GLVXIU1HNI8BWVW057F6MF4VE', 'EditorId': 'e-40AC8ZO6EGGCPJ4DLO48KGGGI', 'NotebookExecutionName': '', 'Status': 'FINISHED', 'StartTime': datetime.datetime(2020, 8, 19, 0, 45, 14, 646000, tzinfo=tzlocal()), 'EndTime': datetime.datetime(2020, 8, 19, 0, 46, 26, 543000, tzinfo=tzlocal())}
     
     
{'NotebookExecutionId': 'ex-IZX5CV8YDUO8JAIWMXN2VH32RUIT1', 'EditorId': 'e-40AC8ZO6EGGCPJ4DLO48KGGGI', 'NotebookExecutionName': '', 'Status': 'FINISHED', 'StartTime': datetime.datetime(2020, 8, 19, 0, 43, 5, 807000, tzinfo=tzlocal()), 'EndTime': datetime.datetime(2020, 8, 19, 0, 44, 31, 632000, tzinfo=tzlocal())}
     
     
{'NotebookExecutionId': 'ex-IZX5AS0PPW55CEDEURZ9NSOWSUJZ6', 'EditorId': 'e-40AC8ZO6EGGCPJ4DLO48KGGGI', 'NotebookExecutionName': '', 'Status': 'FINISHED', 'StartTime': datetime.datetime(2020, 8, 19, 0, 42, 29, 265000, tzinfo=tzlocal()), 'EndTime': datetime.datetime(2020, 8, 19, 0, 43, 48, 320000, tzinfo=tzlocal())}
     
     
{'NotebookExecutionId': 'ex-IZX57YF5Q53BKWLR4I5QZ14HJ7DRS', 'EditorId': 'e-40AC8ZO6EGGCPJ4DLO48KGGGI', 'NotebookExecutionName': '', 'Status': 'FINISHED', 'StartTime': datetime.datetime(2020, 8, 19, 0, 38, 37, 81000, tzinfo=tzlocal()), 'EndTime': datetime.datetime(2020, 8, 19, 0, 40, 39, 646000, tzinfo=tzlocal())}
     
Sleeping for 5 sec...
Stop execution ex-IZX56YJDW1D29Q1PHR32WABU2SAPK
{'NotebookExecution': {'NotebookExecutionId': 'ex-IZX56YJDW1D29Q1PHR32WABU2SAPK', 'EditorId': 'e-40AC8ZO6EGGCPJ4DLO48KGGGI', 'ExecutionEngine': {'Id': 'j-1HYZS6JQKV11Q', 'Type': 'EMR'}, 'NotebookExecutionName': '', 'Status': 'STOPPING', 'StartTime': datetime.datetime(2020, 8, 19, 0, 49, 19, 418000, tzinfo=tzlocal()), 'Arn': 'arn:aws:elasticmapreduce:us-west-1:123456789012:notebook-execution/ex-IZX56YJDW1D29Q1PHR32WABU2SAPK', 'LastStateChangeReason': 'Execution is being stopped for cluster j-1HYZS6JQKV11Q.', 'Tags': []}, 'ResponseMetadata': {'RequestId': '2a77ef73-c1c6-467c-a1d1-7204ab2f6a53', 'HTTPStatusCode': 200, 'HTTPHeaders': {'x-amzn-requestid': '2a77ef73-c1c6-467c-a1d1-7204ab2f6a53', 'content-type': 'application/x-amz-json-1.1', 'content-length': '453', 'date': 'Wed, 19 Aug 2020 00:49:30 GMT'}, 'RetryAttempts': 0}}
```

# Exemples de rubis pour un bloc-notes EMR
<a name="emr-managed-notebooks-headless-ruby"></a>

Cette rubrique contient un exemple Ruby illustrant les fonctionnalités d'un bloc-notes.

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

Les exemples de code Ruby suivants illustrent l'utilisation de l'API d'exécution du bloc-notes.

```
# prepare an Amazon EMR client

emr = Aws::EMR::Client.new(
  region: 'us-east-1',
  access_key_id: 'AKIA...JKPKA',
  secret_access_key: 'rLMeu...vU0OLrAC1',
)
```

## Démarrage de l'exécution du bloc-notes et obtention de l'identifiant d'exécution
<a name="emr-managed-notebooks-headless-ruby-startretrieve"></a>

Dans cet exemple, l'éditeur Amazon S3 et le bloc-notes EMR sont `s3://amzn-s3-demo-bucket/notebooks/e-EA8VGAA429FEQTC8HC9ZHWISK/test.ipynb`.

Pour plus d'informations sur les actions `NotebookExecution` de l'API Amazon EMR, consultez la rubrique [Actions de l'API Amazon EMR](https://docs.aws.amazon.com/emr/latest/APIReference/API_Operations.html).

```
start_response = emr.start_notebook_execution({
    editor_id: "e-EA8VGAA429FEQTC8HC9ZHWISK",
    relative_path: "test.ipynb",
    
    execution_engine: {id: "j-3U82I95AMALGE"},
    
    service_role: "EMR_Notebooks_DefaultRole",
})


notebook_execution_id = start_resp.notebook_execution_id
```

## Description de l'exécution du bloc-notes et impression des détails
<a name="emr-managed-notebooks-headless-ruby-describeprint"></a>

```
describe_resp = emr.describe_notebook_execution({
    notebook_execution_id: notebook_execution_id
})
puts describe_resp.notebook_execution
```

Le résultat des commandes ci-dessus sera le suivant.

```
{
:notebook_execution_id=>"ex-IZX3VTVZWVWPP27KUB90BZ7V9IEDG", 
:editor_id=>"e-EA8VGAA429FEQTC8HC9ZHWISK",
:execution_engine=>{:id=>"j-3U82I95AMALGE", :type=>"EMR", :master_instance_security_group_id=>nil}, 
:notebook_execution_name=>"", 
:notebook_params=>nil, 
:status=>"STARTING", 
:start_time=>2020-07-23 15:07:07 -0700, 
:end_time=>nil, 
:arn=>"arn:aws:elasticmapreduce:us-east-1:123456789012:notebook-execution/ex-IZX3VTVZWVWPP27KUB90BZ7V9IEDG", 
:output_notebook_uri=>nil, 
:last_state_change_reason=>"Execution is starting for cluster j-3U82I95AMALGE.", :notebook_instance_security_group_id=>nil, 
:tags=>[]
}
```

## Filtres de bloc-notes
<a name="emr-managed-notebooks-headless-ruby-filters"></a>

```
"EditorId": "e-XXXX",           [Optional]
"From" : "1593400000.000",    [Optional]
"To" :
```

### Arrêt de l'exécution du bloc-notes
<a name="emr-managed-notebooks-headless-ruby-stop"></a>

```
stop_resp = emr.stop_notebook_execution({
    notebook_execution_id: notebook_execution_id
})
```

# Activation de l'emprunt d'identité pour contrôler l'activité des utilisateurs et des tâches Spark
<a name="emr-managed-notebooks-spark-monitor"></a>

Les blocs-notes Amazon EMR vous permet de configurer l'utilisation de l'identité d'un autre utilisateur sur un cluster Spark. Cette fonctionnalité vous permet de suivre les tâches d'activité lancées à partir de l'éditeur de bloc-notes. De plus, les blocs-notes EMR disposent d'un widget de bloc-notes Jupyter intégré pour visualiser les détails des tâches Spark à côté des résultats de la requête dans l'éditeur du bloc-notes. Le widget est disponible par défaut et ne nécessite aucune configuration spéciale. Toutefois, pour afficher les serveurs d'historique, votre client doit être configuré pour afficher les interfaces web Amazon EMR hébergées sur le nœud primaire.

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

## Configuration de l'emprunt d'identité d'un utilisateur Spark
<a name="emr-managed-notebooks-user-impersonation"></a>

Par défaut, les tâches Spark que les utilisateurs soumettent à l'aide de l'éditeur de bloc-notes semblent provenir d'une identité d'utilisateur `livy` indistincte. Vous pouvez configurer l'emprunt d'identité de l'utilisateur pour le cluster afin que ces tâches soient associées à l'identité de l'utilisateur qui a exécuté le code à la place. Les répertoires d'utilisateurs HDFS sur le nœud primaire sont créés pour chaque identité d'utilisateur qui exécute du code dans le bloc-notes. Par exemple, si l'utilisateur `NbUser1` exécute du code à partir de l'éditeur de bloc-notes, vous pouvez vous connecter au nœud primaire et voir que `hadoop fs -ls /user` affiche le répertoire `/user/user_NbUser1`.

Vous activez cette fonctionnalité en définissant des propriétés dans les classifications de configuration `livy-conf` et `core-site`. Cette fonctionnalité n'est pas disponible par défaut lorsque vous demandez à Amazon EMR de créer un cluster avec un bloc-notes. Pour plus d'informations sur l'utilisation de classifications de configuration pour personnaliser des applications, consultez la rubrique [Configuration des applications](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-configure-apps.html) dans le *Guide de mise à jour d'Amazon EMR*.

Utilisez les classifications de configuration et les valeurs suivantes pour activer l'emprunt d'identité de l'utilisateur pour les blocs-notes EMR :

```
[
    {
        "Classification": "core-site",
        "Properties": {
          "hadoop.proxyuser.livy.groups": "*",
          "hadoop.proxyuser.livy.hosts": "*"
        }
    },
    {
        "Classification": "livy-conf",
        "Properties": {
          "livy.impersonation.enabled": "true"
        }
    }
]
```

## Utilisation du widget de surveillance de tâche Spark
<a name="emr-managed-notebooks-monitoring-widget"></a>

Lorsque vous exécutez du code dans l'éditeur de bloc-notes qui exécute les tâches Spark sur le cluster EMR, la sortie inclut un widget Jupyter Notebook pour la surveillance de tâche Spark. Le widget fournit des détails de la tâche et des liens utiles vers la page de serveur d'historique Spark et la page de l'historique des tâches Hadoop, ainsi que des liens pratiques vers les journaux de tâche dans Amazon S3 pour les tâches échouées.

Pour afficher les pages de serveur d'historique sur le nœud primaire du cluster, vous devez configurer un client SSH et un proxy, le cas échéant. Pour de plus amples informations, veuillez consulter [Affichage des interfaces Web hébergées sur des clusters Amazon EMR](emr-web-interfaces.md). Pour afficher les journaux dans Amazon S3, la journalisation de cluster doit être activée (la valeur par défaut pour les nouveaux clusters). Pour de plus amples informations, veuillez consulter [Afficher des fichiers journaux archivés dans Amazon S3](emr-manage-view-web-log-files.md#emr-manage-view-web-log-files-s3).

Voici un exemple de surveillance d'une tâche Spark.

![\[alt_text\]](http://docs.aws.amazon.com/fr_fr/emr/latest/ManagementGuide/images/spark_monitoring_job_progress.png)


# Sécurité et contrôle d'accès des blocs-notes EMR
<a name="emr-managed-notebooks-security"></a>

Plusieurs fonctionnalités sont disponibles pour vous aider à adapter la sécurité des blocs-notes EMR. Cela permet d'assurer que seuls les utilisateurs autorisés ont accès à un bloc-notes EMR, peuvent travailler avec des blocs-notes et peuvent utiliser l'éditeur de bloc-notes pour exécuter du code sur le cluster. Ces fonctionnalités s'ajoutent aux fonctionnalités de sécurité disponibles pour Amazon EMR et les clusters Amazon EMR. Pour de plus amples informations, veuillez consulter [Sécurité dans Amazon EMR](emr-security.md).
+ Vous pouvez utiliser des déclarations Gestion des identités et des accès AWS de politique ainsi que des balises de bloc-notes pour limiter l'accès. Pour plus d’informations, consultez [Fonctionnement d'Amazon EMR avec IAM](security_iam_service-with-iam.md) et [Exemple de déclarations de stratégie basées sur l'identité pour les bloc-notes EMR](emr-fine-grained-cluster-access.md#emr-managed-notebooks-tags-examples).
+ Les groupes de sécurité Amazon EC2 agissent comme un pare-feu virtuel qui contrôle le trafic réseau entre l'instance primaire du cluster et l'éditeur de bloc-notes. Vous pouvez utiliser les valeurs par défaut ou personnaliser ces groupes de sécurité. Pour de plus amples informations, veuillez consulter [Spécification des groupes de sécurité EC2 pour les blocs-notes EMR](emr-managed-notebooks-security-groups.md).
+ Vous spécifiez un rôle AWS de service qui détermine les autorisations dont dispose un bloc-notes EMR lorsqu'il interagit avec d'autres AWS services. Pour de plus amples informations, veuillez consulter [Rôle de service pour Blocs-notes EMR](emr-managed-notebooks-service-role.md).

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

# Installation et utilisation de noyaux et de bibliothèques dans EMR Studio
<a name="emr-managed-notebooks-installing-libraries-and-kernels"></a>

Chaque bloc-notes EMR est livré avec un ensemble de bibliothèques et de noyaux pré-installés. Vous pouvez installer des bibliothèques et des noyaux supplémentaires dans un cluster EMR si le cluster a accès au référentiel où se trouvent les noyaux et les bibliothèques. Par exemple, pour les clusters dans les sous-réseaux privés, vous devrez peut-être conﬁgurer la traduction d'adresses réseau (NAT) et fournir un chemin d'accès au référentiel PYPI public pour installer une bibliothèque. Pour plus d'informations sur la configuration de l'accès externe pour différentes configurations réseau, consultez la rubrique [Scénarios et exemples](https://docs.aws.amazon.com/vpc/latest/userguide/VPC_Scenarios.html) dans le *Guide de l'utilisateur d'Amazon VPC*.

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)<a name="emr-managed-notebooks-serverless"></a>

Les applications EMR Serverless sont fournies avec les bibliothèques préinstallées suivantes pour Python et : PySpark 
+ **Bibliothèques Python** : ggplot, matplotlib, numpy, pandas, plotly, bokeh, scikit-learn, scipy, scipy
+ **PySpark bibliothèques** —ggplot,matplotlib,numpy,pandas,plotly,bokeh,scikit-learn,scipy, scipy

## Installation des noyaux et des bibliothèques Python sur le nœud primaire d'un cluster
<a name="emr-managed-notebooks-cluster-kernel"></a>

Avec Amazon EMR en version 5.30.0 et ultérieure, à l'exception de la version 6.0.0, vous pouvez installer des noyaux et des bibliothèques Python supplémentaires sur le nœud primaire du cluster. Après l'installation, ces noyaux et bibliothèques sont disponibles pour tout utilisateur exécutant un bloc-notes EMR attaché au cluster. Les bibliothèques Python installées de cette façon ne sont disponibles que pour les processus s'exécutant sur le nœud primaire. Les bibliothèques ne sont pas installées sur les nœuds principaux ou de tâche et ne sont pas disponibles pour les exécuteurs s'exécutant sur ces nœuds.

**Note**  
Pour les versions 5.30.1, 5.31.0 et 6.1.0 d'Amazon EMR, vous devez prendre des mesures supplémentaires afin d'installer les noyaux et les bibliothèques sur le nœud primaire d'un cluster.   
Pour activer cette fonctionnalité, procédez comme suit :  
Assurez-vous que la politique d'autorisations attachée à la fonction du service pour les blocs-notes EMR autorise l'action suivante :  
`elasticmapreduce:ListSteps`  
Pour plus d'informations, consultez la rubrique [Fonction du service pour les bloc-notes EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-service-role.html).
Utilisez le AWS CLI pour exécuter une étape sur le cluster qui configure les Notebooks EMR, comme indiqué dans l'exemple suivant. Vous devez utiliser le nom d'étape `EMRNotebooksSetup`. Remplacez *us-east-1* par la région dans laquelle réside votre cluster. Pour plus d'informations sur l'ajout d'étapes, consultez la rubrique [Ajout d'étapes à un cluster à l'aide de la AWS CLI](https://docs.aws.amazon.com/emr/latest/ManagementGuide/add-step-cli.html).  

   ```
   aws emr add-steps --cluster-id MyClusterID --steps Type=CUSTOM_JAR,Name=EMRNotebooksSetup,ActionOnFailure=CONTINUE,Jar=s3://us-east-1.elasticmapreduce/libs/script-runner/script-runner.jar,Args=["s3://awssupportdatasvcs.com/bootstrap-actions/EMRNotebooksSetup/emr-notebooks-setup.sh"]
   ```

Vous pouvez installer des noyaux et des bibliothèques à l'aide de `pip` ou de `conda` dans le répertoire `/emr/notebook-env/bin` du nœud primaire. 

**Example – Installation de bibliothèques Python**  
À partir du noyau Python3, exécutez la commande magique `%pip` directement depuis une cellule du bloc-notes pour installer les bibliothèques Python.  

```
%pip install pmdarima
```
Vous devrez peut-être redémarrer le noyau pour utiliser les packages mis à jour. Vous pouvez également utiliser la commande magique de Spark [https://ipython.readthedocs.io/en/stable/interactive/magics.html#cellmagic-sh](https://ipython.readthedocs.io/en/stable/interactive/magics.html#cellmagic-sh) pour invoquer `pip`.  

```
%%sh
/emr/notebook-env/bin/pip install -U matplotlib
/emr/notebook-env/bin/pip install -U pmdarima
```
Lorsque vous utilisez un PySpark noyau, vous pouvez soit installer des bibliothèques sur le cluster à l'aide de `pip` commandes, soit utiliser des bibliothèques adaptées à un bloc-notes à partir d'un bloc-notes. PySpark   
Pour exécuter des commandes `pip` sur le cluster depuis le terminal, connectez-vous d'abord au nœud primaire via SSH, comme le montrent les commandes suivantes.  

```
sudo pip3 install -U matplotlib
sudo pip3 install -U pmdarima
```
Vous pouvez également utiliser des bibliothèques adaptées aux blocs-notes. Si vous utilisez des bibliothèques adaptées aux blocs-notes, l'installation de votre bibliothèque est limitée à l'étendue de votre session et s'effectue sur tous les exécuteurs Spark. Pour plus d'informations, consultez la rubrique relative à l'[utilisation de bibliothèques adaptées aux blocs-notes](#emr-managed-notebooks-custom-libraries-limitations).   
Si vous souhaitez empaqueter plusieurs bibliothèques Python dans un PySpark noyau, vous pouvez également créer un environnement virtuel Python isolé. Pour obtenir des exemples d'utilisation, consultez [Using Virtualenv](https://spark.apache.org/docs/latest/api/python/tutorial/python_packaging.html#using-virtualenv).   
Pour créer un environnement virtuel Python dans une session, utilisez la propriété Spark `spark.yarn.dist.archives` à partir de la commande magique `%%configure` dans la première cellule du bloc-notes, comme le montre l'exemple suivant.  

```
%%configure -f
{
   "conf": {
   "spark.yarn.appMasterEnv.PYSPARK_PYTHON":"./environment/bin/python",
   "spark.yarn.appMasterEnv.PYSPARK_DRIVER_PYTHON":"./environment/bin/python",
   "spark.yarn.dist.archives":"s3://amzn-s3-demo-bucket/prefix/my_pyspark_venv.tar.gz#environment",
   "spark.submit.deployMode":"cluster"
   }
}
```
Vous pouvez également créer un environnement d'exécuteur Spark.  

```
%%configure -f
{
   "conf": {
   "spark.yarn.appMasterEnv.PYSPARK_PYTHON":"./environment/bin/python",
   "spark.yarn.appMasterEnv.PYSPARK_DRIVER_PYTHON":"./environment/bin/python",
   "spark.executorEnv.PYSPARK_PYTHON":"./environment/bin/python",
   "spark.yarn.dist.archives":"s3://amzn-s3-demo-bucket/prefix/my_pyspark_venv.tar.gz#environment",
   "spark.submit.deployMode":"cluster"
   }
}
```
Vous pouvez également utiliser `conda` pour installer des bibliothèques Python. Vous n'avez pas besoin d'un accès sudo pour utiliser `conda`. Vous devez vous connecter au nœud primaire à l'aide de SSH, puis exécuter `conda` à partir du terminal. Pour de plus amples informations, veuillez consulter [Connectez-vous au nœud principal du cluster Amazon EMR à l'aide de SSH](emr-connect-master-node-ssh.md). 

**Example – Installation de noyaux**  
L'exemple suivant illustre l'installation du noyau Kotlin à l'aide d'une commande de terminal lorsque vous êtes connecté au nœud primaire d'un cluster :  

```
sudo /emr/notebook-env/bin/conda install kotlin-jupyter-kernel -c jetbrains
```
Ces instructions n'installent pas les dépendances du noyau. Si votre noyau comporte des dépendances tierces, vous devrez peut-être effectuer des étapes de configuration supplémentaires pour pouvoir utiliser le noyau avec votre bloc-notes.

## Considérations et limites relatives aux bibliothèques adaptées aux blocs-notes
<a name="emr-managed-notebooks-custom-libraries-limitations"></a>

Lorsque vous utilisez des bibliothèques adaptées aux blocs-notes, tenez compte des éléments suivants :
+ Les bibliothèques adaptées aux blocs-notes sont disponibles pour les clusters que vous créez avec Amazon EMR versions 5.26.0 et ultérieures.
+ Les bibliothèques de type Notebook sont destinées à être utilisées uniquement avec le noyau. PySpark
+ Tout utilisateur peut installer des bibliothèques supplémentaires à portée de bloc-notes à partir d'une cellule de bloc-notes. Ces bibliothèques ne sont disponibles que pour cet utilisateur de bloc-notes au cours d'une seule session de bloc-notes. Si d'autres utilisateurs ont besoin des mêmes bibliothèques ou si le même utilisateur a besoin des mêmes bibliothèques dans une session différente, la bibliothèque doit être réinstallée.
+ Vous pouvez désinstaller uniquement les bibliothèques qui ont été installées à l'aide de l'API `install_pypi_package`. Vous ne pouvez désinstaller aucune bibliothèque qui a été installée sur le cluster.
+ Si les mêmes bibliothèques avec des versions différentes sont installées sur le cluster et en tant que bibliothèques limitées au bloc-notes, la version de la bibliothèque limitée aux bloc-notes remplace la version de la bibliothèque du cluster.

## Travail avec des bibliothèques adaptées aux blocs-notes
<a name="emr-managed-notebooks-work-with-libraries"></a>

Pour installer des bibliothèques, votre cluster Amazon EMR doit avoir accès au référentiel PyPI dans lequel se trouvent les bibliothèques.

Les exemples suivants illustrent des commandes simples permettant de répertorier, d'installer et de désinstaller des bibliothèques depuis une cellule d'un bloc-notes à l'aide PySpark du noyau et APIs. Pour des exemples supplémentaires, consultez [l'article Installer des bibliothèques Python sur un cluster en cours d'exécution avec EMR](https://aws.amazon.com/blogs/big-data/install-python-libraries-on-a-running-cluster-with-emr-notebooks/) Notebooks sur AWS le Big Data Blog.

**Example – Liste des bibliothèques actuelles**  
La commande suivante répertorie les ensembles Python disponibles pour la session de bloc-notes Spark actuelle. Cette liste contient les bibliothèques installées sur le cluster et les bibliothèques limitées aux bloc-notes.  

```
sc.list_packages()
```

**Example – Installation de la bibliothèque Celery**  
La commande suivante installe la bibliothèque [Celery](https://pypi.org/project/celery/) en tant que bibliothèque limitée aux bloc-notes.  

```
sc.install_pypi_package("celery")
```
Après avoir installé la bibliothèque, la commande suivante confirme qu’elle est disponible sur le pilote et les programmes d'exécution Spark.  

```
import celery
sc.range(1,10000,1,100).map(lambda x: celery.__version__).collect()
```

**Example – Installation de la bibliothèque Arrow, spécification de la version et du référentiel**  
La commande suivante installe la bibliothèque [Arrow](https://pypi.org/project/arrow/) en tant que bibliothèque limitée aux bloc-notes, avec une spécification de la version de la bibliothèque et l'URL du référentiel.  

```
sc.install_pypi_package("arrow==0.14.0", "https://pypi.org/simple")
```

**Example – Désinstallation d'une bibliothèque**  
La commande suivante désinstalle la bibliothèque Arrow, en la supprimant en tant que bibliothèque limitées aux bloc-notes de la session en cours.  

```
sc.uninstall_package("arrow")
```

# – Association de référentiels Git à des blocs-notes EMR
<a name="emr-git-repo"></a>

Vous pouvez associer des référentiels Git à vos blocs-notes Amazon EMR pour les enregistrer dans un environnement à version contrôlée. Vous pouvez associer jusqu'à trois référentiels à un bloc-notes. Les services Git suivants sont pris en charge :
+ [AWS CodeCommit](https://aws.amazon.com/codecommit)
+ [GitHub](https://www.github.com)
+ [Bitbucket](https://bitbucket.org/)
+ [GitLab](https://about.gitlab.com/)

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

Associer des référentiels basés sur Git à votre bloc-notes présente les avantages suivants.
+ **Contrôle de version** – Vous pouvez enregistrer les modifications de code dans un système de contrôle de version afin que vous puissiez consulter l'historique de vos modifications et les inverser de manière sélective.
+ **Collaboration** – Les collaborateurs qui travaillent dans diﬀérents blocs-notes peuvent partager du code via des référentiels Git distants. Les bloc-notes permettent de cloner ou fusionner du code de référentiels Git distants et de renvoyer les modifications vers ces référentiels distants.
+ **Réutilisation du code** — De nombreux blocs-notes Jupyter présentant des techniques d'analyse de données ou d'apprentissage automatique sont disponibles dans des référentiels hébergés publiquement, tels que. GitHub Vous pouvez associer vos blocs-notes à un référentiel pour réutiliser les blocs-notes Jupyter contenus dans ce référentiel.

Pour utiliser vos référentiels Git avec les blocs-notes EMR, ajoutez les référentiels en tant que ressources dans la console Amazon EMR, associez les informations d'identification des référentiels nécessitant une authentification et liez-les à vos blocs-notes. Vous pouvez afficher une liste des référentiels stockés dans votre compte ainsi que les détails concernant chaque référentiel dans la console Amazon EMR. Vous pouvez associer un référentiel Git existant à un bloc-notes lorsque de sa création. 

**Topics**
+ [Conditions préalables et considérations lors de l'intégration d'un bloc-notes EMR à un référentiel](emr-managed-notebooks-git-considerations.md)
+ [Ajout d'un référentiel Git à Amazon EMR](emr-git-repo-add.md)
+ [Mettre à jour ou supprimer un référentiel basé sur Git dans un espace de travail EMR Studio](emr-git-repo-delete.md)
+ [Associer ou dissocier un référentiel Git dans EMR Studio](emr-git-repo-link.md)
+ [Création d'un nouveau bloc-notes avec un dépôt Git associé dans EMR Studio](emr-git-repo-create-notebook.md)
+ [Utiliser les référentiels Git dans un bloc-notes EMR Studio](emr-git-repo-open.md)

# Conditions préalables et considérations lors de l'intégration d'un bloc-notes EMR à un référentiel
<a name="emr-managed-notebooks-git-considerations"></a>

Tenez compte des meilleures pratiques suivantes concernant les validations, les autorisations et l'hébergement lorsque vous planifiez d'intégrer un référentiel Git à EMR Notebooks.

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

## AWS CodeCommit
<a name="code-commit-considerations"></a>

Si vous utilisez un CodeCommit dépôt, vous devez utiliser les informations d'identification Git et HTTPS avec CodeCommit. Les clés SSH et le protocole HTTPS avec l'assistant AWS CLI d'identification ne sont pas pris en charge. CodeCommit ne prend pas en charge les jetons d'accès personnels (PATs). *Pour plus d'informations, voir [Utilisation d'IAM avec CodeCommit : informations d'identification Git, clés SSH et clés d' AWS accès](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_credentials_ssh-keys.html) dans le guide de l'*utilisateur IAM et [Configuration pour les utilisateurs HTTPS à l'aide des informations d'identification Git](https://docs.aws.amazon.com/codecommit/latest/userguide/setting-up-gc.html) dans le guide* de l'AWS CodeCommit utilisateur.*

## Considérations relatives à l'accès et aux autorisations
<a name="access-considerations"></a>

Avant d'associer un référentiel à votre bloc-notes, vous devez vous assurer que votre cluster, votre rôle IAM pour les blocs-notes EMR et vos groupes de sécurité disposent des paramètres et autorisations appropriés. Vous pouvez également configurer des référentiels Git que vous hébergez sur un réseau privé en suivant les instructions de [Configuration d'un référentiel Git hébergé sur un serveur privé pour les blocs-notes EMR](#emr-managed-notebooks-private-git-repo).
+ **Accès à internet du cluster** – L'interface réseau lancée n'a qu'une adresse IP privée. Cela signifie que le cluster auquel votre bloc-notes se connecte doit se trouver dans un sous-réseau privé doté d'une passerelle NAT (Network Address Translation) ou doit pouvoir accéder à Internet via une passerelle privée virtuelle. Pour plus d'informations, consultez la rubrique [Options Amazon VPC](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-clusters-in-a-vpc.html).

  Les groupes de sécurité de votre bloc-notes doivent inclure une règle sortante pour permettre au bloc-notes d'acheminer le trafic vers Internet depuis le cluster. Il est recommandé de créer vos propres groupes de sécurité. Pour plus d'informations, consultez la rubrique [Spécification des groupes de sécurité EC2 pour les bloc-notes EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-security-groups.html).
**Important**  
Si l'interface réseau est lancée dans un sous-réseau public, elle ne pourra pas communiquer avec l'internet par l'intermédiaire d'une passerelle internet (IGW).
+ **Autorisations pour AWS Secrets Manager** : si vous utilisez Secrets Manager pour stocker les secrets que vous utilisez pour accéder à un référentiel, une politique d'autorisation [Rôle de service pour Blocs-notes EMR](emr-managed-notebooks-service-role.md) doit être jointe pour autoriser cette `secretsmanager:GetSecretValue` action.

## Configuration d'un référentiel Git hébergé sur un serveur privé pour les blocs-notes EMR
<a name="emr-managed-notebooks-private-git-repo"></a>

Suivez les instructions ci-dessous pour configurer des référentiels hébergés sur un serveur privé pour les blocs-notes EMR. Vous devez fournir un fichier de configuration contenant des informations sur vos serveurs DNS et Git. Amazon EMR utilise ces informations pour configurer les blocs-notes EMR qui peuvent acheminer le trafic vers vos référentiels hébergés sur un serveur privé.

**Conditions préalables**

Avant de configurer un référentiel Git hébergé sur un serveur privé pour les blocs-notes EMR, vous devez disposer des éléments suivants :
+  Amazon S3 Control Emplacement où les fichiers de votre bloc-notes EMR seront enregistrés.

**Configuration d'un ou de plusieurs référentiels Git hébergés sur un serveur privé pour les blocs-notes EMR**

1. Créez un fichier de configuration à l'aide du modèle fourni. Incluez les valeurs suivantes pour chaque serveur Git que vous souhaitez spécifier dans votre configuration :
   + **`DnsServerIpV4`**- L' IPv4 adresse de votre serveur DNS. Si vous fournissez des valeurs à la fois pour `DnsServerIpV4` et `GitServerIpV4List`, la valeur de `DnsServerIpV4` est prioritaire et sera utilisée pour résoudre votre `GitServerDnsName`.
**Note**  
Pour utiliser des référentiels Git hébergés sur un serveur privé, votre serveur DNS doit autoriser l'accès entrant depuis les blocs-notes EMR. Nous vous recommandons vivement de protéger votre serveur DNS contre tout autre accès non autorisé.
   + **`GitServerDnsName`** – Le nom DNS de votre serveur Git. Par exemple `"git.example.com"`.
   + **`GitServerIpV4List`**- Une liste d' IPv4adresses appartenant à votre/vos serveur (s) Git.

   ```
   [
       {
           "Type": "PrivatelyHostedGitConfig",
           "Value": [
               {
                   "DnsServerIpV4": "<10.24.34.xxx>",
                   "GitServerDnsName": "<enterprise.git.com>",
                   "GitServerIpV4List": [
                       "<xxx.xxx.xxx.xxx>",
                       "<xxx.xxx.xxx.xxx>"
                   ]
               },
               {
                   "DnsServerIpV4": "<10.24.34.xxx>",
                   "GitServerDnsName": "<git.example.com>",
                   "GitServerIpV4List": [
                       "<xxx.xxx.xxx.xxx>",
                       "<xxx.xxx.xxx.xxx>"
                   ]
               }
           ]
       }
   ]
   ```

1. Enregistrez votre fichier de configuration sous `configuration.json`.

1. Chargez le fichier de configuration dans l'emplacement de stockage Amazon S3 que vous avez désigné dans un dossier appelé `life-cycle-configuration`. Par exemple, si votre emplacement S3 par défaut est `s3://amzn-s3-demo-bucket/notebooks`, votre fichier de configuration doit se trouver à l'adresse `s3://amzn-s3-demo-bucket/notebooks/life-cycle-configuration/configuration.json`.
**Important**  
Nous vous recommandons vivement de limiter l'accès à votre dossier `life-cycle-configuration` aux seuls administrateurs des blocs-notes EMR et à la fonction du service associée aux blocs-notes EMR. Vous devez également protéger `configuration.json` contre tout accès non autorisé. Pour des instructions, consultez la rubrique [Contrôle de l'accès à un compartiment avec des politiques utilisateur](https://docs.aws.amazon.com/AmazonS3/latest/userguide/walkthrough1.html) ou [Bonnes pratiques de sécurité pour Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/security-best-practices.html).

   Pour des instructions sur le chargement, consultez les rubriques [Création d'un dossier](https://docs.aws.amazon.com/AmazonS3/latest/userguide/using-folders.html#create-folder) et [Chargement d'objets](https://docs.aws.amazon.com/AmazonS3/latest/userguide/upload-objects.html) dans le *Guide de l'utilisateur d'Amazon Simple Storage Service*.

# Ajout d'un référentiel Git à Amazon EMR
<a name="emr-git-repo-add"></a>

Reportez-vous aux sections suivantes pour savoir comment ajouter un référentiel basé sur Git à un bloc-notes EMR de l'ancienne console ou à un espace de travail EMR Studio dans la console.

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

------
#### [ Console ]

Les blocs-notes EMR étant des espaces de travail EMR Studio dans la nouvelle console, vous pouvez suivre les instructions de [Lier des référentiels Git à un Workspace EMR Studio](emr-studio-git-repo.md) pour associer jusqu'à trois référentiels Git à votre espace de travail.

Vous pouvez également utiliser l'extension JupyterLab Git. Choisissez l'icône **Git** dans la barre latérale gauche de votre bloc-notes Jupyterlab pour accéder à l'extension. Pour plus d'informations sur l'extension, consultez le dépôt [ GitHub jupyterlab-git](https://github.com/jupyterlab/jupyterlab-git).

Pour associer un référentiel Git à un espace de travail, l'administrateur de Studio doit prendre des mesures pour configurer Studio afin d'autoriser la liaison entre les référentiels Git. Pour de plus amples informations, veuillez consulter [Établissez l'accès et les autorisations pour les référentiels Git](emr-studio-enable-git.md).

------

# Mettre à jour ou supprimer un référentiel basé sur Git dans un espace de travail EMR Studio
<a name="emr-git-repo-delete"></a>

Reportez-vous aux sections suivantes pour savoir comment supprimer un référentiel basé sur Git d'un bloc-notes EMR dans l'ancienne console ou d'un espace de travail EMR Studio dans la console.

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

------
#### [ Console ]

Les blocs-notes EMR étant des espaces de travail EMR Studio dans la nouvelle console, vous pouvez vous reporter à [Lier des référentiels Git à un Workspace EMR Studio](emr-studio-git-repo.md) pour plus d'informations sur le travail avec des référentiels Git dans votre espace de travail. Mais pour le moment, vous ne pouvez pas supprimer les référentiels Git des espaces de travail.

------

# Associer ou dissocier un référentiel Git dans EMR Studio
<a name="emr-git-repo-link"></a>

Procédez comme suit pour lier ou dissocier un référentiel basé sur Git à un bloc-notes EMR dans l'ancienne console ou à un espace de travail EMR Studio dans la console.

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

------
#### [ Console ]

Les blocs-notes EMR étant des espaces de travail EMR Studio dans la nouvelle console, vous pouvez vous reporter à [Lier des référentiels Git à un Workspace EMR Studio](emr-studio-git-repo.md) pour plus d'informations sur le travail avec des référentiels Git dans votre espace de travail. Mais pour le moment, vous ne pouvez pas supprimer les référentiels Git des espaces de travail.

------

## Présentation de l'état du référentiel
<a name="emr-managed-notebooks-repository-status"></a>

Un référentiel Git peut avoir l'un des statuts suivants dans la liste des référentiels. Pour de plus amples informations sur la liaison de blocs-notes EMR avec des référentiels Git, veuillez consulter [Associer ou dissocier un référentiel Git dans EMR Studio](#emr-git-repo-link).


| Statut | Signification | 
| --- | --- | 
|  Liens  |  Le référentiel Git est en train d’être lié au bloc-notes. Lorsque l’état du référentiel est **Linking (Liaison en cours)**, vous ne pouvez pas arrêter le bloc-notes.  | 
|  Linked (Lié)  |  Le référentiel Git est lié au bloc-notes. Lorsque le référentiel est à l’état **Linked (Lié)** il est connecté au référentiel distant.  | 
|  Link Failed (Échec du lien)  |  Le référentiel Git n'a pas pu se lier au bloc-notes. Vous pouvez réessayer.  | 
|  Unlinking (Annulation du lien en cours)  |  Le lien entre le référentiel Git et le bloc-notes est en cours d’annulation. Lorsque le référentiel est à l’état **Unlinking (Annulation du lien en cours)**, vous ne pouvez pas arrêter le bloc-notes. L’annulation d’un lien entre un référentiel Git et un bloc-notes déconnecte uniquement le bloc-notes du référentiel distant sans supprimer de code du bloc-notes.  | 
|  Unlink Failed (Échec de l’annulation du lien)  |  L’annulation du lien entre le référentiel Git et le bloc-notes a échoué. Vous pouvez réessayer.  | 

# Création d'un nouveau bloc-notes avec un dépôt Git associé dans EMR Studio
<a name="emr-git-repo-create-notebook"></a>

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

**Création d'un bloc-notes et association de celui-ci à des référentiels Git dans l'ancienne console Amazon EMR**

1. Suivez les instructions décrites dans [Création d'un bloc-notes dans EMR Studio](emr-managed-notebooks-create.md).

1. Pour **Security group (Groupe de sécurité)**, choisissez **Use your own security group (Utiliser votre propre groupe de sécurité)**.
**Note**  
Les groupes de sécurité de votre bloc-notes doivent inclure une règle sortante pour permettre au bloc-notes d'acheminer le trafic vers Internet via le cluster. Il est recommandé de créer vos propres groupes de sécurité. Pour plus d'informations, consultez la rubrique [Spécification des groupes de sécurité EC2 pour les bloc-notes EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-security-groups.html).

1. Pour **Git repositories (Référentiels Git)**, **choisissez le référentiel** à associer au bloc-notes.

   1. Choisissez un référentiel stocké en tant que ressource dans votre compte, puis choisissez **Save (Enregistrer)**.

   1. Pour ajouter un nouveau référentiel en tant que ressource dans votre compte, choisissez **add a new repository (ajouter un nouveau référentiel)**. Exécutez le flux de travail **Add repository (Ajouter un référentiel)** dans une nouvelle fenêtre. 

# Utiliser les référentiels Git dans un bloc-notes EMR Studio
<a name="emr-git-repo-open"></a>

**Note**  
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton **Créer un espace** de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. [Pour plus d'informations, consultez [Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html).](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html)

Vous pouvez choisir d'**ouvrir dans JupyterLab** ou d'**ouvrir dans Jupyter** lorsque vous ouvrez un bloc-notes. 

Si vous choisissez d'ouvrir le bloc-notes dans Jupyter, une liste de fichiers et de dossiers extensibles dans le bloc-notes s'affiche. Vous pouvez exécuter manuellement des commandes Git comme ci-après dans une cellule de bloc-notes. 

```
!git pull origin primary
```

Pour ouvrir un des référentiels supplémentaires, accédez à d’autres dossiers. 

Si vous choisissez d'ouvrir le bloc-notes avec une JupyterLab interface, vous pouvez utiliser l'extension JupyterLab Git préinstallée. Pour plus d'informations sur l'extension, consultez [jupyterlab-git](https://github.com/jupyterlab/jupyterlab-git).