View a markdown version of this page

Tokenizzazione dei dati - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dalla Patch 198. Le UDF Python esistenti continueranno a funzionare fino al 30 giugno 2026. Per ulteriori informazioni, consulta il post del blog.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Tokenizzazione dei dati

La tokenizzazione è il processo di sostituzione dei valori effettivi con valori opachi per scopi di sicurezza dei dati. Security-sensitive le applicazioni utilizzano la tokenizzazione per sostituire dati sensibili come le informazioni di identificazione personale (PII) o le informazioni sanitarie protette (PHI) con token per ridurre i rischi per la sicurezza. La detokenizzazione ri-sostituisce i token con valori effettivi per gli utenti autorizzati con policy di sicurezza appropriati.

Per l'integrazione con servizi di tokenizzazione di terze parti, è possibile utilizzare le funzioni definite dall'utente (UDF) di Amazon Redshift create utilizzandoAWS Lambda. Per ulteriori informazioni, consultare Funzioni Lambda definite dall'utente nella Guida per gli sviluppatori di Amazon Redshift. Ad esempio, consultare Protezione.

Amazon Redshift invia richieste di tokenizzazione a un server di tokenizzazione a cui si accede tramite un'API REST o un endpoint predefinito. Due o più funzioni Lambda gratuite elaborano le richieste di tokenizzazione e detokenizzazione. Per questa elaborazione, è possibile utilizzare le funzioni Lambda fornite da un provider di tokenizzazione di terze parti. È possibile utilizzare anche le funzioni Lambda che vengono registrate come funzioni Lambda definite dall'utente in Amazon Redshift.

Si supponga, ad esempio, che venga inviata una query che richiami una funzione definita dall'utente di tokenizzazione o detokenizzazione in una colonna. Il cluster Amazon Redshift esegue lo spool delle righe di argomenti applicabili e invia tali righe in batch alla funzione Lambda in parallelo. I dati vengono trasferiti tra i nodi di calcolo Amazon Redshift e Lambda in una connessione di rete isolata separata che non è accessibile ai client. La funzione Lambda passa i dati all'endpoint del server di tokenizzazione. Il server di tokenizzazione tokenizza o detokenizza i dati, se necessario, e li restituisce. Le funzioni Lambda quindi trasmettono i risultati al cluster Amazon Redshift per ulteriori elaborazioni, se necessario, e poi restituiscono i risultati della query.