Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Connessioni Redshift
<a name="aws-glue-programming-etl-connect-redshift-home"></a>

Puoi usare AWS Glue for Spark per leggere e scrivere su tabelle nei database Amazon Redshift. Quando si connette ai database Amazon Redshift, AWS Glue sposta i dati tramite Amazon S3 per ottenere il massimo throughput, utilizzando SQL e comandi Amazon Redshift. `COPY` `UNLOAD` In AWS Glue 4.0 e versioni successive, puoi utilizzare l'[integrazione Amazon Redshift per Apache Spark per](https://docs.aws.amazon.com/redshift/latest/mgmt/spark-redshift-connector.html) leggere e scrivere con ottimizzazioni e funzionalità specifiche di Amazon Redshift oltre a quelle disponibili durante la connessione tramite versioni precedenti. 

Scopri come AWS Glue sta semplificando più che mai per gli utenti di Amazon Redshift la migrazione a AWS Glue per l'integrazione dei dati senza server e l'ETL.

[![AWS Videos](http://img.youtube.com/vi/ZapycBq8TKU/0.jpg)](http://www.youtube.com/watch?v=ZapycBq8TKU)


## Configurazione delle connessioni Redshift
<a name="aws-glue-programming-etl-connect-redshift-configure"></a>

Per utilizzare i cluster Amazon Redshift in AWS Glue, sono necessari alcuni prerequisiti:
+ Una directory Amazon S3 da utilizzare per l'archiviazione temporanea durante la lettura e la scrittura sul database.
+ Un Amazon VPC che consente la comunicazione tra il cluster Amazon Redshift, il job AWS Glue e la directory Amazon S3.
+ Autorizzazioni IAM appropriate sul job AWS Glue e sul cluster Amazon Redshift.

### Configurazione dei ruoli IAM
<a name="aws-glue-programming-etl-redshift-config-iam"></a>

**Configurazione del ruolo per il cluster Amazon Redshift**  
Il tuo cluster Amazon Redshift deve essere in grado di leggere e scrivere su Amazon S3 per integrarsi con AWS Glue jobs. Per consentire ciò, puoi associare i ruoli IAM al cluster Amazon Redshift a cui desideri connetterti. Il tuo ruolo dovrebbe disporre di una policy che consenta la lettura e la scrittura nella tua directory temporanea di Amazon S3. Il tuo ruolo dovrebbe avere un rapporto di fiducia che consenta al servizio `redshift.amazonaws.com` di `AssumeRole`.

**Associazione di un ruolo IAM ad Amazon Redshift**

1. **Prerequisiti:** un bucket o una directory Amazon S3 utilizzato per l'archiviazione temporanea dei file.

1. Identifica le autorizzazioni Amazon S3 che occorreranno al cluster Amazon Redshift. Quando spostano dati da e verso un cluster Amazon Redshift, i job AWS Glue emettono istruzioni COPY e UNLOAD su Amazon Redshift. Se il tuo job modifica una tabella in Amazon Redshift, AWS Glue emetterà anche istruzioni CREATE LIBRARY. Per informazioni sulle autorizzazioni specifiche di Amazon S3 necessarie ad Amazon Redshift per eseguire queste istruzioni, consulta la documentazione di Amazon Redshift: Amazon Redshift: Permissions to access other [Resources](https://docs.aws.amazon.com/redshift/latest/dg/copy-usage_notes-access-permissions.html). AWS 

1. Nella console IAM, crea una policy IAM con le autorizzazioni necessarie. Per ulteriori informazioni sulla creazione di una policy, consulta la pagina [Creazione di policy IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_create.html). 

1. Da IAM, crea un ruolo e un rapporto di fiducia che consenta ad Amazon Redshift di assumere il ruolo. Segui le istruzioni nella documentazione IAM [Per creare un ruolo per un servizio](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_create_for-service.html#roles-creatingrole-service-console) (console) AWS 
   + Quando ti viene chiesto di scegliere un caso d'uso del AWS servizio, scegli «Redshift - Personalizzabile».
   + Quando ti viene chiesto di collegare una policy, scegli la policy che hai definito in precedenza.
**Nota**  
Per ulteriori informazioni sulla configurazione dei ruoli per Amazon Redshift, [consulta Autorizzazione di Amazon Redshift ad AWS accedere ad altri servizi per tuo conto nella documentazione di Amazon](https://docs.aws.amazon.com/redshift/latest/mgmt/authorizing-redshift-service.html) Redshift. 

1. Da Amazon Redshift, associa il ruolo al tuo cluster Amazon Redshift. Segui le istruzioni nella [documentazione di Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/copy-unload-iam-role.html).

   Seleziona l'opzione evidenziata nella console Amazon Redshift per configurare questa impostazione:  
![Un esempio di dove gestire le autorizzazioni IAM nella console Amazon Redshift.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/RS-role-config.png)

**Nota**  
 Per impostazione predefinita, i lavori AWS Glue passano le credenziali temporanee di Amazon Redshift create utilizzando il ruolo specificato per eseguire il lavoro. Non è consigliabile utilizzare queste credenziali. Per motivi di sicurezza, queste credenziali scadono dopo 1 ora. 

**Imposta il ruolo per il lavoro AWS Glue**  
Il job AWS Glue richiede un ruolo per accedere al bucket Amazon S3. Non sono necessarie le autorizzazioni IAM per il cluster Amazon Redshift, il tuo accesso è controllato dalla connettività in Amazon VPC e dalle credenziali del database.

### Configurazione di Amazon VPC
<a name="aws-glue-programming-etl-redshift-config-vpc"></a>

**Per configurare l'accesso ai datastore Amazon Redshift**

1. Accedi Console di gestione AWS e apri la console Amazon Redshift all'indirizzo. [https://console.aws.amazon.com/redshiftv2/](https://console.aws.amazon.com/redshiftv2/)

1. Nel pannello di navigazione a sinistra, seleziona **Cluster**.

1. Seleziona il nome del cluster al quale desideri accedere da AWS Glue.

1. Nella sezione **Proprietà cluster** scegli un gruppo di sicurezza in **Gruppi di sicurezza VPC** per permettere l'uso a AWS Glue. Registra il nome del gruppo di sicurezza scelto per riferimenti futuri. La scelta del gruppo di sicurezza apre l'elenco **Gruppi di sicurezza** della console Amazon EC2.

1. Scegli il gruppo di sicurezza da modificare e passa alla scheda **In entrata**.

1. Aggiungi una regola autoreferenziale per permettere ai componenti di AWS Glue di comunicare tra loro. In particolare, aggiungi o verifica che sia presente una regola con **Tipo** `All TCP`, **Protocollo** `TCP`, **Intervallo porte** che include tutte le porte e **Origine** corrispondente al nome del gruppo di sicurezza indicato da **ID gruppo**. 

   La regola in entrata è simile alla seguente:   
****    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/it_it/glue/latest/dg/aws-glue-programming-etl-connect-redshift-home.html)

   Esempio:  
![Esempio di regola autoreferenziale per il traffico in entrata.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/SetupSecurityGroup-Start.png)

1. Aggiungi una regola anche per il traffico in uscita. Quindi, apri il traffico in uscita per tutte le porte, ad esempio:  
****    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/it_it/glue/latest/dg/aws-glue-programming-etl-connect-redshift-home.html)

   In alternativa, crea una regola autoreferenziale in cui **Tipo** `All TCP`, **Protocollo** sta per `TCP` e **Intervallo porte** include tutte le porte, la cui **Destinazione** ha lo stesso nome del gruppo di sicurezza dell'**ID gruppo**. Se usi un endpoint VPC Amazon S3, aggiungi anche una regola HTTPS per l'accesso di Amazon S3. {{s3-prefix-list-id}}È necessario nella regola del gruppo di sicurezza per consentire il traffico dal VPC all'endpoint VPC Amazon S3.

   Esempio:  
****    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/it_it/glue/latest/dg/aws-glue-programming-etl-connect-redshift-home.html)

### Configura AWS Glue
<a name="aws-glue-programming-etl-redshift-config-glue"></a>

Dovrai creare una connessione AWS Glue Data Catalog che fornisca informazioni sulla connessione Amazon VPC.

**Per configurare la connettività Amazon Redshift (Amazon VPC) a AWS Glue nella console:**

1. Crea una connessione a Catalogo dati seguendo i passaggi indicati nella sezione [Aggiungere una AWS Glue connessione](console-connections.md). Dopo aver creato la connessione, mantieni il nome della connessione per {{connectionName}} il passaggio successivo.
   + Quando selezioni un **Tipo di connessione**, seleziona **Amazon Redshift**.
   + Quando selezioni un **Cluster Redshift**, seleziona il tuo cluster in base al nome.
   + Fornisci informazioni di connessione predefinite per un utente Amazon Redshift sul tuo cluster.
   + Le impostazioni di Amazon VPC verranno configurate automaticamente.
**Nota**  
Quando crei una connessione **Amazon Redshift** tramite l'SDK AWS , dovrai fornire manualmente il valore `PhysicalConnectionRequirements` per il tuo Amazon VPC.

1. Nella configurazione del lavoro AWS Glue, fornisci {{connectionName}} una **connessione di rete aggiuntiva**.

## Esempio: lettura da tabelle Amazon Redshift
<a name="aws-glue-programming-etl-connect-redshift-read"></a>

 È possibile leggere da cluster Amazon Redshift e ambienti Amazon Redshift serverless. 

**Prerequisiti:** una tabella Amazon Redshift da cui desideri leggere. Segui i passaggi della sezione precedente, [Configurazione delle connessioni Redshift](#aws-glue-programming-etl-connect-redshift-configure) dopodiché dovresti avere l'URI Amazon S3 per una directory temporanea {{temp-s3-dir}} e un ruolo IAM,{{rs-role-name}}, (nell'account{{role-account-id}}).

------
#### [ Using the Data Catalog ]

**Prerequisiti aggiuntivi**: un database Catalogo dati e una tabella dai quali desideri che la tabella Amazon Redshift legga. Per ulteriori informazioni su Catalogo dati, consultare la pagina [Scoperta e catalogazione dei dati in AWS Glue](catalog-and-crawler.md). Dopo aver creato una voce per la tabella Amazon Redshift, identificherai la tua connessione con un {{redshift-dc-database-name}} segno e. {{redshift-table-name}}

**Configurazione:** nelle opzioni della funzione identificherai la tabella di Catalogo dati con i parametri `database` e `table_name`. Identificherai la directory temporanea Amazon S3 con `redshift_tmp_dir`. Dovrai inoltre fornire {{rs-role-name}} l'utilizzo della `aws_iam_role` chiave nel `additional_options` parametro.

```
 glueContext.create_dynamic_frame.from_catalog(
    database = "{{redshift-dc-database-name}}", 
    table_name = "{{redshift-table-name}}", 
    redshift_tmp_dir = args["{{temp-s3-dir}}"], 
    additional_options = {"aws_iam_role": "arn:aws:iam::{{role-account-id}}:role/{{rs-role-name}}"})
```

------
#### [ Connecting directly ]

**Prerequisiti aggiuntivi:** è necessario il nome della tabella Amazon Redshift (. {{redshift-table-name}} Avrai bisogno delle informazioni di connessione JDBC per il cluster Amazon Redshift in cui è archiviata quella tabella. Fornirai le informazioni di connessione con{{host}}, {{port}}{{redshift-database-name}}, {{username}} e. {{password}}

Quando lavori con i cluster Amazon Redshift, puoi recuperare le informazioni di connessione dalla console Amazon Redshift. Se utilizzi Amazon Redshift serverless, consulta la sezione [Connecting to Amazon Redshift Serverless](https://docs.aws.amazon.com//redshift/latest/mgmt/serverless-connecting.html) nella documentazione di Amazon Redshift.

**Configurazione:** nelle opzioni della funzione identificherai i parametri di connessione con `url`, `dbtable`, `user` e `password`. Identificherai la tua directory temporanea Amazon S3 con `redshift_tmp_dir`. Quando utilizzi `from_options`, puoi specificare il tuo ruolo IAM utilizzando `aws_iam_role`. La sintassi è simile alla connessione tramite Catalogo dati, ma è necessario inserire i parametri nella mappa `connection_options`.

È una cattiva pratica codificare le password negli script AWS Glue. Valuta la possibilità di archiviare le password Gestione dei segreti AWS e recuperarle nello script con SDK for Python (Boto3).

```
my_conn_options = {  
    "url": "jdbc:redshift://{{host}}:{{port}}/{{redshift-database-name}}",
    "dbtable": "{{redshift-table-name}}",
    "user": "{{username}}",
    "password": "{{password}}",
    "redshiftTmpDir": args["{{temp-s3-dir}}"],
    "aws_iam_role": "arn:aws:iam::{{account id}}:role/{{rs-role-name}}"
}

df = glueContext.create_dynamic_frame.from_options("redshift", my_conn_options)
```

------

## Esempio: scrittura su tabelle Amazon Redshift
<a name="aws-glue-programming-etl-connect-redshift-write"></a>

 È possibile scrivere su cluster Amazon Redshift e ambienti Amazon Redshift serverless. 

**Prerequisiti:** un cluster Amazon Redshift e segui i passaggi della [Configurazione delle connessioni Redshift](#aws-glue-programming-etl-connect-redshift-configure) sezione precedente, dopodiché dovresti avere l'URI Amazon S3 per una directory temporanea e un ruolo {{rs-role-name}} IAM{{temp-s3-dir}},, (nell'account). {{role-account-id}} Avrai anche bisogno di un `DynamicFrame` del quale desideri scrivere il contenuto nel database. 

------
#### [ Using the Data Catalog ]

**Prerequisiti aggiuntivi**: un database Catalogo dati sul quale desideri che scrivano il cluster e la tabella Amazon Redshift. Per ulteriori informazioni su Catalogo dati, consulta la pagina [Scoperta e catalogazione dei dati in AWS Glue](catalog-and-crawler.md). Identificherai la tua connessione con {{redshift-dc-database-name}} e la tabella di destinazione con. {{redshift-table-name}}

**Configurazione:** nelle opzioni della funzione identificherai il database di Catalogo dati con il parametro `database`, quindi fornirai la tabella con `table_name`. Identificherai la tua directory temporanea Amazon S3 con `redshift_tmp_dir`. Fornirai anche {{rs-role-name}} l'utilizzo della `aws_iam_role` chiave nel `additional_options` parametro.

```
 glueContext.write_dynamic_frame.from_catalog(
    frame = {{input dynamic frame}}, 
    database = "{{redshift-dc-database-name}}", 
    table_name = "{{redshift-table-name}}", 
    redshift_tmp_dir = args["{{temp-s3-dir}}"], 
    additional_options = {"aws_iam_role": "arn:aws:iam::{{account-id}}:role/{{rs-role-name}}"})
```

------
#### [ Connecting through a AWS Glue connection ]

È possibile connettersi ad Amazon Redshift direttamente utilizzando il metodo `write_dynamic_frame.from_options`. Tuttavia, anziché inserire i dettagli di connessione direttamente nello script, puoi fare riferimento ai dettagli di connessione archiviati in una connessione a Catalogo dati con il metodo `from_jdbc_conf`. È possibile eseguire questa operazione senza effettuare il crawling o creare tabelle di Catalogo dati per il database. Per ulteriori informazioni sulle connessioni a Catalogo dati, consulta la pagina [Connessione ai dati](glue-connections.md).

**Prerequisiti aggiuntivi:** una connessione a Catalogo dati per il database, una tabella Amazon Redshift da cui desideri leggere

**Configurazione:** identificherai la tua connessione al Data Catalog con{{dc-connection-name}}. Identificherai il database e la tabella Amazon Redshift con {{redshift-table-name}} e. {{redshift-database-name}} Fornirai le informazioni di connessione a Catalogo dati con `catalog_connection` e le informazioni relative ad Amazon Redshift con `dbtable` e `database`. La sintassi è simile alla connessione tramite Catalogo dati, ma è necessario inserire i parametri nella mappa `connection_options`. 

```
my_conn_options = {
    "dbtable": "{{redshift-table-name}}",
    "database": "{{redshift-database-name}}",
    "aws_iam_role": "arn:aws:iam::{{role-account-id}}:role/{{rs-role-name}}"
}

glueContext.write_dynamic_frame.from_jdbc_conf(
    frame = {{input dynamic frame}}, 
    catalog_connection = "{{dc-connection-name}}", 
    connection_options = my_conn_options, 
    redshift_tmp_dir = args["{{temp-s3-dir}}"])
```

------

## Indicazioni di riferimento alle opzione di connessione ad Amazon Redshift
<a name="w2aac67c11c24b8c21c15"></a>

Le opzioni di connessione di base utilizzate per tutte le connessioni JDBC AWS Glue per configurare informazioni come `url` `user` e `password` sono coerenti per tutti i tipi JDBC. Per ulteriori informazioni sui parametri JDBC standard, consulta la pagina [Indicazioni di riferimento alle opzioni di connessione a JDBC](aws-glue-programming-etl-connect-jdbc-home.md#aws-glue-programming-etl-connect-jdbc).

Il tipo di connessione Amazon Redshift richiede alcune opzioni di connessione aggiuntive:
+ `"redshiftTmpDir"`: (obbligatorio) il percorso Amazon S3 in cui i dati temporanei possono essere caricati durante la copia dal database.
+ `"aws_iam_role"`: (facoltativo) l'ARN di un ruolo IAM. Il job AWS Glue passerà questo ruolo al cluster Amazon Redshift per concedere al cluster le autorizzazioni necessarie per completare le istruzioni del job.

### Opzioni di connessione aggiuntive disponibili in AWS Glue 4.0\+
<a name="aws-glue-programming-etl-redshift-enhancements"></a>

Puoi anche passare le opzioni per il nuovo connettore Amazon Redshift tramite le opzioni di connessione AWS Glue. Per un elenco completo delle opzioni di connettori supportate, consulta la sezione *Parametri SQL Spark* in [Integrazione di Amazon Redshift per Apache Spark](https://docs.aws.amazon.com/redshift/latest/mgmt/spark-redshift-connector.html).

Per comodità, ribadiamo di seguito alcune nuove opzioni:


| Name | Obbligatorio | Predefinita | Description | 
| --- | --- | --- | --- | 
| autopushdown | No | TRUE | Applica il pushdown di predicati e query acquisendo e analizzando i piani logici di Spark per le operazioni SQL. Le operazioni vengono tradotte in una query SQL e quindi eseguite in Amazon Redshift per migliorare le prestazioni. | 
| autopushdown.s3\_result\_cache | No | FALSE | Memorizza nella cache la query SQL per scaricare i dati sulla mappatura dei percorsi di Amazon S3 in memoria, in modo che la stessa query non debba essere eseguita nuovamente nella stessa sessione di Spark. Supportato solo quando `autopushdown` è abilitato. | 
| unload\_s3\_format | No | PARQUET | PARQUET: scarica i risultati della query in formato Parquet.<br />TESTO: scarica i risultati della query in formato testo delimitato da barra verticale. | 
| sse\_kms\_key | No | N/D | La chiave AWS SSE-KMS da utilizzare per la crittografia durante `UNLOAD` le operazioni anziché la crittografia predefinita per. AWS | 
| extracopyoptions | No | N/D | Un elenco di opzioni ulteriori da aggiungere al comando `COPY` di Amazon Redshift durante il caricamento dei dati, come `TRUNCATECOLUMNS` o `MAXERROR n` (per altre opzioni, consulta [COPY: parametri facoltativi](https://docs.aws.amazon.com/redshift/latest/dg/r_COPY.html#r_COPY-syntax-overview-optional-parameters)). <br />È importante notare che, poiché queste opzioni vengono aggiunte alla fine del comando `COPY`, è possibile utilizzare solo le opzioni rilevanti alla fine del comando. Questo dovrebbe coprire la maggior parte dei casi d'uso possibili. | 
| cvsnullstring (sperimentale) | No | NULL | Il valore di stringa da scrivere per i valori null quando si utilizza il `tempformat` CSV. Dovrebbe trattarsi di un valore che non è presente nei dati effettivi. | 

Questi nuovi parametri possono essere utilizzati nei seguenti modi.

**Nuove opzioni per il miglioramento delle prestazioni**  
Il nuovo connettore introduce alcune nuove opzioni di miglioramento delle prestazioni:
+ `autopushdown`: abilitato per impostazione predefinita.
+ `autopushdown.s3_result_cache`: disabilitato per impostazione predefinita.
+ `unload_s3_format`: `PARQUET` per impostazione predefinita.

Per informazioni sull'utilizzo di queste opzioni, consultare [Integrazione di Amazon Redshift per Apache Spark](https://docs.aws.amazon.com/redshift/latest/mgmt/spark-redshift-connector.html). Si consiglia di non attivare ` autopushdown.s3_result_cache` quando si eseguono operazioni di lettura e scrittura miste perché i risultati memorizzati nella cache potrebbero contenere informazioni obsolete. L'opzione `unload_s3_format` è impostata su `PARQUET` per impostazione predefinita per il comando `UNLOAD` per migliorare le prestazioni e ridurre i costi di archiviazione. Per utilizzare il comportamento predefinito del comando `UNLOAD`, reimposta l'opzione su `TEXT`.

**Nuova opzione di crittografia per la lettura**  
Per impostazione predefinita, i dati nella cartella temporanea utilizzata da AWS Glue durante la lettura dei dati dalla tabella Amazon Redshift vengono crittografati tramite la crittografia `SSE-S3`. Per utilizzare le chiavi gestite dal cliente di AWS Key Management Service (AWS KMS) per crittografare i dati, puoi impostare da `("sse_kms_key" → kmsKey)` dove KSMKey [proviene l'ID](https://docs.aws.amazon.com/kms/latest/developerguide/find-cmk-id-arn.html) della chiave AWS KMS, anziché l'opzione di impostazione precedente nella versione 3.0. `("extraunloadoptions" → s"ENCRYPTED KMS_KEY_ID '$kmsKey'")` AWS Glue

```
datasource0 = glueContext.create_dynamic_frame.from_catalog(
  database = "{{database-name}}", 
  table_name = "{{table-name}}", 
  redshift_tmp_dir = args["TempDir"],
  additional_options = {"sse_kms_key":"<{{KMS_KEY_ID}}>"}, 
  transformation_ctx = "datasource0"
)
```

**Supporto dell'URL JDBC basato su IAM**  
Il nuovo connettore supporta un URL JDBC basato su IAM, quindi non è necessario inserire un segreto or. user/password Con un URL JDBC basato su IAM, il connettore utilizza il ruolo di runtime del processo per accedere all'origine dati Amazon Redshift. 

Fase 1: collegamento della seguente politica minima obbligatoria al ruolo di runtime del processo AWS Glue.

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "VisualEditor0",
            "Effect": "Allow",
            "Action": "redshift:GetClusterCredentials",
            "Resource": [
                "arn:aws:redshift:{{us-east-1}}:{{111122223333}}:dbgroup:<cluster name>/*",
                "arn:aws:redshift:*:{{111122223333}}:dbuser:*/*",
                "arn:aws:redshift:{{us-east-1}}:{{111122223333}}:dbname:<cluster name>/<database name>"
            ]
        },
        {
            "Sid": "VisualEditor1",
            "Effect": "Allow",
            "Action": "redshift:DescribeClusters",
            "Resource": "*"
        }
    ]
}
```

------

Fase 2: uso dell'URL JDBC basato su IAM come segue. Specifica una nuova opzione `DbUser` con il nome utente Amazon Redshift con cui ti stai connettendo.

```
conn_options = {
     // IAM-based JDBC URL
    "url": "jdbc:redshift:iam://{{<cluster name>}}:<region>/<database name>",
    "dbtable": dbtable,
    "redshiftTmpDir": redshiftTmpDir,
    "aws_iam_role": aws_iam_role,
    "DbUser": "<Redshift User name>" // required for IAM-based JDBC URL
    }

redshift_write = glueContext.write_dynamic_frame.from_options(
    frame=dyf,
    connection_type="redshift",
    connection_options=conn_options
)

redshift_read = glueContext.create_dynamic_frame.from_options(
    connection_type="redshift",
    connection_options=conn_options
)
```

**Nota**  
Un `DynamicFrame` al momento supporta un URL JDBC basato su IAM solo con un ` DbUser` nel flusso di lavoro `GlueContext.create_dynamic_frame.from_options`. 

## Migrazione da AWS Glue versione 3.0 alla versione 4.0
<a name="aws-glue-programming-etl-redshift-migrating"></a>

In AWS Glue 4.0, i job ETL hanno accesso a un nuovo connettore Amazon Redshift Spark e a un nuovo driver JDBC con diverse opzioni e configurazioni. Il nuovo connettore e driver Amazon Redshift sono stati progettati per le prestazioni e garantiscono la coerenza transazionale dei dati. Questi prodotti sono illustrati nella documentazione di Amazon Redshift. Per ulteriori informazioni, consulta:
+ [Integrazione di Amazon Redshift per Apache Spark](https://docs.aws.amazon.com/redshift/latest/mgmt/spark-redshift-connector.html)
+ [Driver JDBC Amazon Redshift, versione 2.1](https://docs.aws.amazon.com/redshift/latest/mgmt/jdbc20-download-driver.html)

**Restrizione dei nomi e degli identificatori di tabelle/colonne**  
Il nuovo connettore e il driver Amazon Redshift Spark hanno un requisito più limitato per il nome della tabella Redshift. Per ulteriori informazioni, consulta [Nomi e identificatori](https://docs.aws.amazon.com/redshift/latest/dg/r_names.html) per definire il nome della tabella Amazon Redshift. Il flusso di lavoro relativo ai segnalibri del processo potrebbe non funzionare con un nome di tabella che non corrisponde alle regole e con determinati caratteri, ad esempio uno spazio.

Se hai tabelle legacy con nomi non conformi alle regole dei [nomi e degli identificatori](https://docs.aws.amazon.com/redshift/latest/dg/r_names.html) e riscontri problemi con i segnalibri (processi che rielaborano i vecchi dati delle tabelle Amazon Redshift), ti consigliamo di rinominare le tabelle. Per ulteriori informazioni, consultare [Esempi di ALTER TABLE](https://docs.aws.amazon.com/redshift/latest/dg/r_ALTER_TABLE_examples_basic.html). 

**Modifica del formato temporale predefinito in Dataframe**  
Il connettore Spark di AWS Glue versione 3.0 imposta automaticamente `tempformat` su CSV durante la scrittura su Amazon Redshift. Per continuità, in AWS Glue versione 3.0, ` DynamicFrame` è ancora impostato su `tempformat` per l'uso di `CSV`. Se in precedenza hai utilizzato Spark Dataframe APIs direttamente con il connettore Amazon Redshift Spark, puoi impostarlo in modo esplicito su CSV nelle `tempformat` opzioni/. `DataframeReader` `Writer` Altrimenti, `tempformat` è impostato su `AVRO` nel nuovo connettore Spark.

**Modifica di comportamento: associazione del tipo di dati Amazon Redshift REAL al tipo di dati Spark FLOAT anziché DOUBLE**  
In AWS Glue versione 3.0, Amazon Redshift `REAL` viene convertito in un tipo ` DOUBLE` Spark. Il nuovo connettore Amazon Redshift Spark ha aggiornato il comportamento in modo che il tipo ` REAL` Amazon Redshift venga viene convertito e di nuovo dal tipo `FLOAT` Spark. Se si dispone di un caso d'uso precedente in cui si desidera ancora che il tipo `REAL` Amazon Redshift sia mappato a un tipo `DOUBLE` Spark, è possibile utilizzare la seguente soluzione alternativa:
+ Per un `DynamicFrame`, mappa il tipo `Float` a un tipo `Double` con `DynamicFrame.ApplyMapping`. Per un `Dataframe`, è necessario usare `cast`.

Esempio di codice:

```
dyf_cast = dyf.apply_mapping([('a', 'long', 'a', 'long'), ('b', 'float', 'b', 'double')])
```

**Gestione del tipo di dati VARBYTE**  
Quando si lavora con tipi di dati AWS Glue 3.0 e Amazon Redshift, AWS Glue 3.0 converte Amazon `VARBYTE` Redshift in tipo Spark. `STRING` Tuttavia, il connettore Spark Amazon Redshift più recente non supporta il tipo di dati `VARBYTE`. Per aggirare questa limitazione, è possibile [creare una vista Redshift](https://docs.aws.amazon.com/redshift/latest/dg/r_CREATE_VIEW.html) che trasformi le colonne `VARBYTE` in un tipo di dati supportato. In seguito, è possibile utilizzare il nuovo connettore per caricare i dati da questa vista anziché dalla tabella originale, in modo da garantire la compatibilità pur mantenendo l'accesso ai dati `VARBYTE`.

Esempio di query Redshift:

```
CREATE VIEW {{view_name}} AS SELECT FROM_VARBYTE({{varbyte_column}}, 'hex') FROM {{table_name}}
```