

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Preparazione dei dati mediante sessioni interattive AWS Glue
<a name="studio-notebooks-glue"></a>

Le [sessioni interattive di AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/interactive-sessions-overview.html) sono un servizio serverless che puoi utilizzare per raccogliere, trasformare, pulire e preparare i dati per l’archiviazione nei data lake e nelle pipeline dei dati. Le sessioni interattive di AWS Glue forniscono un ambiente di runtime Apache Spark serverless e on demand, che puoi inizializzare in pochi secondi su un’unità di elaborazione dati (DPU) dedicata, senza dover allocare e gestire complesse infrastrutture dei cluster di calcolo. Dopo l'inizializzazione, puoi sfogliare il catalogo AWS Glue dati, eseguire query di grandi dimensioni, accedere ai dati governati da AWS Lake Formation e analizzare e preparare in modo interattivo i dati utilizzando Spark, direttamente nei tuoi notebook Studio o Studio Classic. Puoi quindi utilizzare i dati preparati per addestrare, ottimizzare e distribuire i modelli utilizzando gli strumenti di machine learning appositamente progettati all'interno di Studio o Studio Classic. SageMaker Se desideri un servizio Spark serverless con un controllo moderato della configurabilità e della flessibilità, dovresti prendere in considerazione le sessioni AWS Glue interattive per i carichi di lavoro di preparazione dei dati.

È possibile avviare una sessione AWS Glue interattiva avviando un JupyterLab notebook in Studio o Studio Classic. Quando avvii il notebook, scegli il kernel integrato `Glue PySpark and Ray` o `Glue Spark`. Questo avvia automaticamente una sessione Spark interattiva e senza server. Non è necessario fornire o gestire alcun cluster o infrastruttura di elaborazione. Dopo l’inizializzazione, puoi esplorare e interagire con i dati direttamente dai notebook Studio o Studio Classic.

Prima di iniziare la sessione AWS Glue interattiva in Studio o Studio Classic, è necessario impostare i ruoli e le politiche appropriati. Inoltre, potrebbe dover fornire l’accesso a risorse aggiuntive, ad esempio a un bucket di archiviazione Amazon S3. Per ulteriori informazioni sulle policy IAM richieste, consulta [Autorizzazioni per sessioni AWS Glue interattive in Studio o Studio Classic](getting-started-glue-sm.md#glue-sm-iam).

Studio e Studio Classic forniscono una configurazione predefinita per la sessione AWS Glue interattiva, tuttavia, puoi utilizzare AWS Glue il catalogo completo dei comandi magici di Jupyter per personalizzare ulteriormente il tuo ambiente. Per informazioni sui Jupyter magics predefiniti e aggiuntivi che puoi usare nella tua sessione interattiva, consulta. AWS Glue [Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic](getting-started-glue-sm.md#glue-sm-magics)
+ Gli utenti di Studio Classic che iniziano una sessione AWS Glue interattiva, possono scegliere tra le seguenti immagini e kernel:
  + Immagini: `SparkAnalytics 1.0`, `SparkAnalytics 2.0`
  + Kernel: `Glue Python [PySpark and Ray]` e `Glue Spark`
+ Per gli utenti di Studio, utilizzate l'[immagine di SageMaker distribuzione](https://github.com/aws/sagemaker-distribution) predefinita e selezionate uno `Glue Python [PySpark and Ray]` o un `Glue Spark` kernel.

# Inizia con le sessioni AWS Glue interattive
<a name="getting-started-glue-sm"></a>

In questa guida, imparerai come avviare una sessione AWS Glue interattiva in SageMaker AI Studio Classic e gestire il tuo ambiente con Jupyter magics.

## Autorizzazioni per sessioni AWS Glue interattive in Studio o Studio Classic
<a name="glue-sm-iam"></a>

Questa sezione elenca le politiche richieste per eseguire sessioni AWS Glue interattive in Studio o Studio Classic e spiega come configurarle. In particolare, descrive in dettaglio come:
+ `AwsGlueSessionUserRestrictedServiceRole`Associa la policy gestita al tuo ruolo di esecuzione dell' SageMaker IA.
+ Crea una policy personalizzata in linea sul tuo ruolo di esecuzione dell' SageMaker IA.
+ Modifica la relazione di fiducia del tuo ruolo di esecuzione dell' SageMaker IA.

**Per collegare la policy gestita `AwsGlueSessionUserRestrictedServiceRole` al tuo ruolo di esecuzione**

1. Apri la [console IAM](https://console.aws.amazon.com/iam/).

1. Selezionare **Ruoli** nel pannello a sinistra.

1. Trova il ruolo di esecuzione di Studio Classic utilizzato dal tuo profilo utente. Per informazioni su come visualizzare un profilo utente, consulta [Visualizzazione dei profili utente in un dominio](domain-user-profile-view.md).

1. Scegli il nome del ruolo per accedere alla relativa pagina di riepilogo.

1. Nella scheda **Autorizzazioni**, selezionare **Collega policy** dal menu a discesa **Aggiungi autorizzazioni**.

1. Seleziona la casella di controllo accanto alla policy gestita `AwsGlueSessionUserRestrictedServiceRole`.

1. Scegli **Collega policy**. 

   La pagina di riepilogo mostra le policy gestite appena aggiunte.

   

**Per creare una policy personalizzata in linea sul tuo ruolo di esecuzione**

1. Seleziona **Crea policy in linea** nel menu a discesa **Aggiungi autorizzazioni**.

1. Seleziona la scheda **JSON**.

1. Copia e incolla nella seguente policy.

------
#### [ JSON ]

****  

   ```
   {
       "Version":"2012-10-17",		 	 	 
       "Statement": [
           {
               "Sid": "uniqueStatementId",
   
               "Effect": "Allow",
               "Action": [
   	     "iam:GetRole",
                   "iam:PassRole",
                   "sts:GetCallerIdentity"
               ],
               "Resource": "arn:aws:iam::*:role/GlueServiceRole*"
           }
       ]
   }
   ```

------

1. Scegliere **Esamina policy**.

1. Inserisci un **Nome**, quindi seleziona **Crea policy**. 

   La pagina di riepilogo mostra le policy personalizzate appena aggiunte.

   

**Per modificare la relazione di attendibilità del ruolo di esecuzione**

1. Seleziona la scheda **Relazioni di attendibilità**.

1. Seleziona **Modifica policy di attendibilità**.

1. Copia e incolla nella seguente policy.

------
#### [ JSON ]

****  

   ```
   {
   "Version":"2012-10-17",		 	 	 
   "Statement": [
       {
           "Effect": "Allow",
           "Principal": {
               "Service": [
                   "glue.amazonaws.com",
                   "sagemaker.amazonaws.com"
               ]
           },
           "Action": "sts:AssumeRole"
       }
   ]
   }
   ```

------

1. Scegli **Aggiorna policy**.

Puoi aggiungere ruoli e policy aggiuntivi se devi accedere ad altre risorse AWS . Per una descrizione dei ruoli e delle policy aggiuntivi che puoi includere, consulta [le sessioni interattive con IAM](https://docs.aws.amazon.com/glue/latest/dg/glue-is-security.html) nella AWS Glue documentazione.

## Propagazione di tag
<a name="glue-sm-tag-propagation"></a>

I tag vengono comunemente utilizzati per tenere traccia e allocare i costi, controllare l'accesso alla sessione, isolare le risorse e altro ancora. Per ulteriori informazioni sull'aggiunta di metadati alle risorse AWS utilizzando i tag o per dettagli sui casi d'uso comuni, consulta [Informazioni aggiuntive](#more-information).

Puoi abilitare la propagazione automatica dei AWS tag in nuove sessioni AWS Glue interattive create dall'interfaccia utente di Studio o Studio Classic. Quando viene creata una sessione AWS Glue interattiva da Studio o Studio Classic, tutti i [tag definiti dall'](https://docs.aws.amazon.com/awsaccountbilling/latest/aboutv2/custom-tags.html)utente allegati al profilo utente o allo spazio condiviso vengono trasferiti nella nuova sessione AWS Glue interattiva. Inoltre, Studio e Studio Classic aggiungono automaticamente due tag interni AWS generati (`sagemaker:user-profile-arn`e`sagemaker:domain-arn`) o (`sagemaker:shared-space-arn`and)`sagemaker:domain-arn`) alle nuove sessioni AWS Glue interattive create dalla relativa interfaccia utente. Puoi utilizzare questi tag per aggregare i costi tra singoli domini, profili utente o spazi.

### Abilitare la propagazione di tag
<a name="enable-propagation"></a>

Per abilitare la propagazione automatica dei tag in nuove sessioni AWS Glue interattive, imposta le seguenti autorizzazioni per il tuo ruolo di esecuzione SageMaker AI e il ruolo IAM associato alla sessione: AWS Glue 

**Nota**  
Per impostazione predefinita, il ruolo associato alla sessione AWS Glue interattiva è lo stesso del ruolo di esecuzione SageMaker AI. È possibile specificare un ruolo di esecuzione diverso per la sessione AWS Glue interattiva utilizzando il comando `%iam_role` magico. Per informazioni sui comandi magici di Jupyter disponibili per configurare le sessioni interattive di AWS Glue , consulta [Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic](#glue-sm-magics).
+ *Sul tuo ruolo di esecuzione SageMaker AI*: crea una nuova policy in linea e incolla il seguente file JSON. La policy concede al ruolo di esecuzione l'autorizzazione a descrivere (`DescribeUserProfile`,`DescribeSpace`,`DescribeDomain`) ed elencare i tag (`ListTag`) impostati nei profili utente, negli spazi condivisi e SageMaker nel dominio AI.

  ```
  {
      "Effect": "Allow",
      "Action": [
          "sagemaker:ListTags"
      ],
      "Resource": [
          "arn:aws:sagemaker:*:*:user-profile/*",
          "arn:aws:sagemaker:*:*:space/*"
      ]
  },
  {
      "Effect": "Allow",
      "Action": [
          "sagemaker:DescribeUserProfile"
      ],
      "Resource": [
          "arn:aws:sagemaker:*:*:user-profile/*"
      ]
  },
  {
      "Effect": "Allow",
      "Action": [
          "sagemaker:DescribeSpace"
      ],
      "Resource": [
          "arn:aws:sagemaker:*:*:space/*"
      ]
  }
  {
      "Effect": "Allow",
      "Action": [
          "sagemaker:DescribeDomain"
      ],
      "Resource": [
          "arn:aws:sagemaker:*:*:domain/*"
      ]
  }
  ```
+ *Sul ruolo IAM della tua sessione AWS Glue *: crea una nuova policy in linea e incolla il seguente file JSON. La policy concede al tuo ruolo l’autorizzazione per collegare tag (`TagResource`) alla sessione o di recuperarne l'elenco di tag (`GetTags`).

  ```
  {
      "Effect": "Allow",
      "Action": [
          "glue:TagResource",
          "glue:GetTags"
      ],
      "Resource": [
          "arn:aws:glue:*:*:session/*"
      ]
  }
  ```

**Nota**  
Gli errori che si verificano durante l'applicazione di tali autorizzazioni non impediscono la creazione di sessioni interattive. AWS Glue I dettagli sul motivo dell'errore sono disponibili nei log di Studio o Studio Classic. [CloudWatch](https://docs.aws.amazon.com//sagemaker/latest/dg/monitoring-cloudwatch.html)
È necessario riavviare il kernel della sessione AWS Glue interattiva per propagare l'aggiornamento del valore di un tag.

È importante tenere a mente i seguenti punti:
+ Una volta che un tag è collegato a una sessione, non può essere rimosso mediante propagazione.

  È possibile rimuovere i tag da una sessione AWS Glue interattiva direttamente tramite AWS CLI, l' AWS Glue API o il. [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/) Ad esempio, utilizzando AWS CLI, puoi rimuovere un tag fornendo l'ARN della sessione e le chiavi dei tag che desideri rimuovere come segue:

  ```
  aws glue untag-resource \
  --resource-arn arn:aws:glue:region:account-id:session:session-name \
  --tags-to-remove tag-key1,tag-key2
  ```
+ Studio e Studio Classic aggiungono due tag interni AWS generati ((`sagemaker:user-profile-arn`and`sagemaker:domain-arn`) o (`sagemaker:shared-space-arn`and)`sagemaker:domain-arn`) alle nuove sessioni AWS Glue interattive create dalla relativa interfaccia utente. Questi tag vengono conteggiati nel limite di 50 tag impostato su tutte le AWS risorse. Sia `sagemaker:user-profile-arn` che `sagemaker:shared-space-arn` contengono l’ID del dominio a cui appartengono.
+ I tag `aws:``AWS:`, le chiavi che iniziano con o qualsiasi combinazione di lettere maiuscole e minuscole come prefisso per le chiavi non vengono propagati e sono riservati all'uso. AWS 

### Informazioni aggiuntive
<a name="more-information"></a>

Per ulteriori informazioni tagging, fai riferimento alle seguenti risorse.
+ [Per ulteriori informazioni sull'aggiunta di metadati alle AWS risorse con l'aggiunta di tag, consulta Etichettatura delle risorse. AWS](https://docs.aws.amazon.com/tag-editor/latest/userguide/tagging.html)
+ Per informazioni sul tracciamento dei costi tramite tag, consulta [Analisi dei costi](https://docs.aws.amazon.com/whitepapers/latest/sagemaker-studio-admin-best-practices/cost-attribution.html) nelle best practice di amministrazione di Studio.
+ [Per informazioni sul controllo dell'accesso AWS Glue basato sulle chiavi dei tag, consulta ABAC with. AWS Glue](glue/latest/dg/security_iam_service-with-iam.html#security_iam_service-with-iam-tags)

## Avvia la tua sessione AWS Glue interattiva su Studio o Studio Classic
<a name="glue-sm-launch"></a>

Dopo aver creato i ruoli, le politiche e il dominio SageMaker AI, puoi avviare la sessione AWS Glue interattiva in Studio o Studio Classic.

1. Accedi alla console SageMaker AI all'indirizzo [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Nel riquadro di navigazione a sinistra, seleziona **Studio**.

1. Nella pagina di destinazione di Studio, seleziona il dominio e il profilo utente per avviare Studio.

1. Scegli **Open Studio** e avvia una JupyterLab o più applicazioni Studio Classic.

1. Nella vista Jupyter, scegli **File**, quindi **Nuovo**, quindi **Notebook**.

1. Per gli utenti di Studio Classic: nel menu a discesa **Immagine**, seleziona **SparkAnalytics 1.0** o **SparkAnalytics2.0**. Nel menu a discesa del **kernel**, seleziona Glue **Spark o Glue** **Python [and** Ray]. PySpark Scegli **Seleziona**.

   Per gli utenti di Studio, selezionate un kernel **Glue Spark** o **Glue Python PySpark [and** Ray]

1. (facoltativo) Utilizza le magie Jupyter per personalizzare il tuo ambiente. Per ulteriori informazioni sulle magie Jupyter, consulta [Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic](#glue-sm-magics).

1. Inizia a scrivere gli script di elaborazione di dati Spark. Il seguente [taccuino](https://github.com/aws/amazon-sagemaker-examples/blob/main/use-cases/pyspark_etl_and_training/pyspark-etl-training.ipynb) illustra un end-to-end flusso di lavoro per ETL su un set di dati di grandi dimensioni utilizzando una sessione AWS Glue interattiva, l'analisi esplorativa dei dati, la preelaborazione dei dati e infine l'addestramento di un modello sui dati elaborati con l'intelligenza artificiale. SageMaker 

## Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic
<a name="glue-sm-magics"></a>

**Nota**  
Tutte le configurazioni magiche vengono trasferite alle sessioni successive per tutta la durata del kernel. AWS Glue 

Puoi usare Jupyter magics nella tua sessione AWS Glue interattiva per modificare i parametri di sessione e configurazione. Le magie sono brevi comandi con il prefisso `%` all’inizio delle celle di Jupyter che forniscono un modo semplice e veloce per aiutarti a controllare l'ambiente. Nella sessione AWS Glue interattiva, le seguenti magie sono impostate automaticamente per te:


| Magia | Valore predefinito | 
| --- | --- | 
| %glue\$1version |  3.0  | 
| %iam\$1role |  *execution role attached to your SageMaker AI domain*  | 
| %region |  la tua regione  | 

Puoi usare le magie per personalizzare ulteriormente il tuo ambiente. Ad esempio, se desideri modificare il numero di worker assegnati al tuo lavoro dal valore predefinito di cinque a 10, puoi specificare `%number_of_workers 10`. Se desideri configurare la sessione in modo che si interrompa dopo 10 minuti di inattività anziché il 2880 predefinito, puoi specificare `%idle_timeout 10`.

Tutte le magie di Jupyter attualmente disponibili in AWS Glue sono disponibili anche in Studio o Studio Classic. Per l'elenco completo dei AWS Glue magics disponibili, consulta [Configurazione delle sessioni AWS Glue interattive](https://docs.aws.amazon.com/glue/latest/dg/interactive-sessions-magics.html) per i notebook Jupyter e Studio. AWS Glue 

# AWS Glue prezzi delle sessioni interattive
<a name="glue-sm-pricing"></a>

Quando utilizzi sessioni AWS Glue interattive su notebook Studio o Studio Classic, l'utilizzo delle risorse su notebook Studio AWS Glue e Studio ti viene addebitato separatamente.

AWS i costi per le sessioni AWS Glue interattive si basano sulla durata della sessione e sul numero di unità di elaborazione dati (DPU) utilizzate. Ti viene addebitata una tariffa oraria per il numero di carichi di lavoro DPUs utilizzati per eseguire i carichi di lavoro, fatturati in incrementi di un secondo. AWS Glue le sessioni interattive assegnano un valore predefinito di cinque DPUs e ne richiedono almeno due. DPUs È inoltre prevista una durata di fatturazione minima di un minuto per ogni sessione interattiva. [Per visualizzare le AWS Glue tariffe e gli esempi di prezzo o per stimare i costi utilizzando il Calcolatore AWS dei prezzi, consulta AWS Glue la pagina dei prezzi.](https://aws.amazon.com/glue/pricing)

Il notebook Studio o Studio Classic viene eseguito su un’istanza Amazon EC2 e l’addebito avviene in base al tipo di istanza scelto e alla durata dell’utilizzo. Studio Classic ti assegna un tipo di istanza EC2 `ml-t3-medium` predefinito quando selezioni l’immagine `SparkAnalytics` e il kernel associato. Puoi modificare il tipo di istanza per il tuo notebook Studio Classic per adattarlo al tuo carico di lavoro. Per informazioni sui prezzi di Studio e Studio Classic, consulta i [ SageMaker prezzi di Amazon](https://aws.amazon.com/sagemaker/pricing).