

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Eliminazione di file orfani
<a name="orphan-file-deletion"></a>

 AWS Glue Data Catalog ti permette di rimuovere file orfani dalle tue tabelle Iceberg. I file orfani sono file non referenziati presenti nell'origine dati di Amazon S3 nella posizione della tabella specificata, non sono tracciati dai metadati della tabella Iceberg e sono più vecchi del limite di età configurato. Questi file orfani possono accumularsi nel tempo a causa di errori in operazioni come compattazione, cali di partizione o riscritture di tabelle, e occupare spazio di archiviazione non necessario.

L'ottimizzatore per l'eliminazione dei file AWS Glue orfani analizza i metadati della tabella e i file di dati effettivi, identifica i file orfani e li elimina per recuperare spazio di archiviazione. L'ottimizzatore rimuove solo i file creati dopo la data di creazione dell'ottimizzatore che soddisfano anche i criteri di eliminazione configurati. I file creati prima o alla data di creazione dell'ottimizzatore non vengono mai eliminati.

**Logica di eliminazione dei file orfani**

1. Controllo della data: confronta la data di creazione del file con quella di creazione dell'ottimizzatore. Se il file è precedente o contemporaneo alla data di creazione dell'ottimizzatore, il file viene ignorato.

1. Controllo della configurazione dell'ottimizzatore: se il file è più recente della data di creazione dell'ottimizzatore, valuta il file rispetto al limite di età configurato. L'ottimizzatore elimina il file se soddisfa i criteri di eliminazione. Ignora il file, se non corrisponde ai criteri.

 È possibile avviare l'eliminazione dei file orfani creando un ottimizzatore di tabelle per l'eliminazione dei file orfani nel catalogo dati.

**Importante**  
 Per impostazione predefinita, l'eliminazione dei file orfani valuta i file in tutta la posizione della tabella. AWS Glue Sebbene sia possibile configurare un prefisso secondario per limitare l'ambito di valutazione utilizzando il parametro API, è necessario assicurarsi che la posizione della tabella non contenga file provenienti da altre origini dati o tabelle. Se la posizione della tabella si sovrappone ad altre origini dati, il servizio potrebbe identificare ed eliminare i file non correlati come orfani. 

**Topics**
+ [Attivazione dell'eliminazione di file orfani](enable-orphan-file-deletion.md)
+ [Aggiornamento dell'ottimizzatore per l'eliminazione dei file orfani](update-orphan-file-deletion.md)
+ [Disabilitazione dell'eliminazione di file orfani](disable-orphan-file-deletion.md)

# Attivazione dell'eliminazione di file orfani
<a name="enable-orphan-file-deletion"></a>

 Puoi utilizzare la AWS Glue console o l' AWS API per abilitare l'eliminazione di file orfani per le tue tabelle Apache Iceberg nel Data Catalog. AWS CLI Per le nuove tabelle, puoi scegliere Apache Iceberg come formato di tabella e abilitare l'ottimizzatore dell'eliminazione dei file orfani quando crei la tabella. La conservazione degli snapshot è disabilitata per impostazione predefinita per le nuove tabelle.

------
#### [ Console ]

**Abilitazione dell'eliminazione di file orfani**

1.  Apri la AWS Glue console all'indirizzo [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/)e accedi come amministratore del data lake, creatore della tabella o utente a cui sono state concesse `lakeformation:GetDataAccess` le autorizzazioni `glue:UpdateTable` e sulla tabella. 

1. Nel pannello di navigazione, in **Catalogo dati**, seleziona **Tabelle**.

1. Nella pagina **Tabelle**, scegli una tabella Iceberg in cui desideri abilitare l'eliminazione dei file orfani.

   Scegli la scheda **Ottimizzazione della tabella** nella sezione inferiore della pagina e scegli **Abilita**, **Eliminazione dei file orfani** da **Azioni**. 

   Puoi anche scegliere **Abilita** in **Ottimizzazione** dal menu **Azioni** situato nell'angolo in alto a destra della pagina.

1. Nella pagina **Abilita ottimizzazione**, scegli **Eliminazione dei file orfani** in **Opzioni di ottimizzazione**.

1. Se scegli di utilizzare le **Impostazioni predefinite**, tutti i file orfani verranno eliminati dopo 3 giorni. Se desideri conservare i file orfani per un numero specifico di giorni, scegli **Personalizza impostazioni**.

1. Quindi, scegli un ruolo IAM con le autorizzazioni necessarie per eliminare i file orfani.

1. Se hai configurazioni di policy di sicurezza in cui l'ottimizzatore di tabelle Iceberg deve accedere ai bucket Amazon S3 da uno specifico Virtual Private Cloud (VPC), crea una connessione di rete o usane una esistente. AWS Glue 

   Se non hai già configurato una connessione AWS Glue VPC, creane una nuova seguendo i passaggi nella sezione [Creazione di connessioni per connettori](https://docs.aws.amazon.com/glue/latest/dg/creating-connections.html) utilizzando la AWS Glue console o /SDK. AWS CLI

1. Se scegli **Personalizza impostazioni**, inserisci il numero di giorni durante cui mantenere i file prima dell'eliminazione in **Configurazione dell'eliminazione dei file orfani**. Puoi anche specificare l'intervallo tra due esecuzioni consecutive dell'ottimizzatore. Il valore predefinito è 24 ore.

1. Scegli **Abilita ottimizzazione**.

------
#### [ AWS CLI ]

 Per abilitare l'eliminazione di file orfani per una tabella Iceberg in AWS Glue, devi creare un ottimizzatore di tabella di tipo `orphan_file_deletion` e impostare il campo su true. `enabled` Per creare un ottimizzatore di eliminazione di file orfano per una tabella Iceberg utilizzando il AWS CLI, è possibile utilizzare il seguente comando:

```
aws glue create-table-optimizer \
 --catalog-id 123456789012 \
 --database-name iceberg_db \
 --table-name iceberg_table \
 --table-optimizer-configuration '{"roleArn":"arn:aws:iam::123456789012:role/optimizer_role","enabled":true, "vpcConfiguration":{
"glueConnectionName":"glue_connection_name"}, "orphanFileDeletionConfiguration":{"icebergConfiguration":{"orphanFileRetentionPeriodInDays":3, "location":'S3 location'}}}'\
 --type orphan_file_deletion
```

 Questo comando crea un ottimizzatore per l'eliminazione dei file orfani per la tabella Iceberg specificata. I parametri chiave sono:
+ roleARN: l'ARN del ruolo IAM con autorizzazioni di accesso al bucket S3 e alle risorse Glue.
+ enabled: impostare su true per abilitare l'ottimizzatore.
+ orphanFileRetentionPeriodInDays — Il numero di giorni per conservare i file orfani prima di eliminarli (minimo 1 giorno).
+ type: imposta su orphan\$1file\$1deletion per creare un ottimizzatore per l'eliminazione dei file orfani.

 Dopo averlo creato, l'ottimizzatore di tabelle, eseguirà periodicamente l'eliminazione dei file orfani (una volta al giorno se lasciato abilitato). Puoi controllare le esecuzioni utilizzando l'`list-table-optimizer-runs`API. Il processo di eliminazione dei file orfani identificherà ed eliminerà i file che non sono tracciati nei metadati Iceberg per la tabella.

------
#### [ API ]

[CreateTableOptimizer](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-table-optimizers.html#aws-glue-api-table-optimizers-CreateTableOptimizer)Operazione di chiamata per creare l'ottimizzatore per l'eliminazione dei file orfani per una tabella specifica.

------

# Aggiornamento dell'ottimizzatore per l'eliminazione dei file orfani
<a name="update-orphan-file-deletion"></a>

 È possibile modificare la configurazione dell'ottimizzatore per l'eliminazione dei file orfani, ad esempio modificando il periodo di conservazione per i file orfani o il ruolo IAM utilizzato dall'ottimizzatore tramite AWS Glue console o l'operazione AWS CLI. `UpdateTableOptimizer` 

------
#### [ Console di gestione AWS ]

**Per aggiornare l'ottimizzatore per l'eliminazione dei file orfani**

1.  Scegliere **Catalogo dati** e poi **Tabelle**. Dall'elenco delle tabelle, selezionare la tabella in cui aggiornare la configurazione dell'ottimizzatore per l'eliminazione dei file orfani.

1. Nella parte inferiore della pagina **Dettagli tabella**, scegliere **Ottimizzazione tabella**, poi scegliere **Modifica**. 

1.  Nella pagina **Modifica ottimizzazione**, apportare le modifiche desiderate. 

1.  Scegli **Save** (Salva). 

------
#### [ AWS CLI ]

 È possibile utilizzare la `update-table-optimizer` chiamata per aggiornare l'ottimizzatore per l'eliminazione dei file orfani in AWS Glue, è possibile utilizzare call. Ciò consente di modificare `OrphanFileDeletionConfiguration` nel campo `icebergConfiguration` in cui è possibile specificare il `OrphanFileRetentionPeriodInDays` aggiornato per impostare il numero di giorni in cui mantenere i file orfani, per specificare la posizione della tabella Iceberg da cui eliminare questi ultimi. 

```
aws glue update-table-optimizer \
 --catalog-id 123456789012 \
 --database-name iceberg_db \
 --table-name Iceberg_table \
 --table-optimizer-configuration '{"roleArn":"arn:aws:iam::123456789012:role/optimizer_role","enabled":true, "vpcConfiguration":{"glueConnectionName":"glue_connection_name"},"orphanFileDeletionConfiguration":{"icebergConfiguration":{"orphanFileRetentionPeriodInDays":5}}}' \
 --type orphan_file_deletion
```

------
#### [ API ]

Richiama l'[UpdateTableOptimizer](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-table-optimizers.html#aws-glue-api-table-optimizers-UpdateTableOptimizer)operazione per aggiornare l'ottimizzatore per la cancellazione dei file orfani per una tabella.

------

 

# Disabilitazione dell'eliminazione di file orfani
<a name="disable-orphan-file-deletion"></a>

 È possibile disabilitare l'ottimizzatore di eliminazione dei file orfani per una particolare tabella Apache Iceberg utilizzando la console o. AWS Glue AWS CLI

------
#### [ Console ]

**Per disabilitare l'eliminazione di file orfani**

1. Scegliere **Catalogo dati** e poi **Tabelle**. Dall'elenco delle tabelle, seleziona la tabella Iceberg per la quale vuoi disabilitare l'ottimizzatore per l'eliminazione dei file orfani.

1. Nella parte inferiore della pagina **Dettagli tabella**, seleziona la scheda **Ottimizzazione tabella**.

1. Scegli **Azioni**, quindi seleziona **Disabilita**, **Eliminazione file orfani**.

   Puoi anche selezionare **Disabilita** in **Ottimizzazione** dal menu **Azioni**.

1.  Scegli **Disabilita ** nel messaggio di conferma. Potrai riattivare l'ottimizzatore per l'eliminazione dei file orfani in un secondo momento. 

    Dopo la conferma, l'ottimizzatore per l'eliminazione dei file orfani viene disabilitato e lo stato dell'eliminazione dei file orfani torna su `Not enabled`.

------
#### [ AWS CLI ]

Nell'esempio seguente, sostituisci l'ID dell'account con un ID account valido. AWS Sostituisci il nome del database e della tabella con quello effettivo della tabella Iceberg e del database. Sostituisci `roleArn` con il nome della AWS risorsa (ARN) del ruolo IAM e il nome effettivo del ruolo IAM che dispone delle autorizzazioni necessarie per disabilitare l'ottimizzatore.

```
aws glue update-table-optimizer \
  --catalog-id 123456789012 \
  --database-name iceberg_db \
  --table-name iceberg_table \
  --table-optimizer-configuration '{"roleArn":"arn:aws:iam::123456789012:role/optimizer_role", "enabled":'false'}'\ 
  --type orphan_file_deletion
```

------
#### [ API ]

Richiama l'[UpdateTableOptimizer](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-table-optimizers.html#aws-glue-api-table-optimizers-UpdateTableOptimizer)operazione per disabilitare l'ottimizzatore di conservazione delle istantanee per una tabella specifica.

------