

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Usando AWS Lake Formation com AWS Glue
<a name="glue-features-lf"></a>

Engenheiros e DevOps profissionais de dados usam AWS Glue o Extract, Transform and Load (ETL) com o Apache Spark para realizar transformações em seus conjuntos de dados no Amazon S3 e carregar os dados transformados em lagos de dados e armazéns de dados para análise, aprendizado de máquina e desenvolvimento de aplicativos. Com equipes diferentes acessando o mesmo conjunto de dados no Amazon S3, é imperativo conceder e restringir permissões com base em seus perfis.

AWS Lake Formation é construído e AWS Glue os serviços interagem das seguintes maneiras:
+ Lake Formation e AWS Glue compartilham o mesmo catálogo de dados.
+ Os seguintes atributos do console Lake Formation invocam o console AWS Glue: 
  + Trabalhos — Para obter mais informações, consulte [Como adicionar trabalhos](https://docs.aws.amazon.com/glue/latest/dg/add-job.html) no *Guia do desenvolvedor do AWS Glue *.
  + Crawlers – Para obter mais informações, consulte [Catalogação de tabelas com um Crawler](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html) *Guia do desenvolvedor do AWS Glue .*
+ Os fluxos de trabalho gerados quando você usa um esquema do Lake Formation são fluxos de trabalho AWS Glue. Você pode visualizar e gerenciar esses fluxos de trabalho no console do Lake Formation e no console AWS Glue.
+ As transformações de machine learning são fornecidas com o Lake Formation e são baseadas em operações de API do AWS Glue. Você cria e gerencia transformações de machine learning no console AWS Glue. Para obter mais informações, consulte [Transformações de machine learning](https://docs.aws.amazon.com/glue/latest/dg/machine-learning.html) no *Guia do desenvolvedor do AWS Glue *.

 Você pode usar o controle de acesso refinado do Lake Formation para gerenciar seus recursos existentes do catálogo de dados e os locais de dados do Amazon S3.

**nota**  
AWS Glue 5.0 ou superior oferece suporte a controles de acesso refinados nas tabelas Iceberg e Hive que são apoiadas pelo S3. Esse recurso permite que você configure controles de acesso em nível de tabela, linha, coluna e célula para consultas de leitura em suas AWS Glue tarefas do Apache Spark.

## Suporte para tipos de tabelas transacionais
<a name="tables.glue"></a>

A aplicação das permissões do Lake Formation permite que você proteja seus dados transacionais em seus data lakes baseados no Amazon S3. A tabela abaixo lista os formatos de tabela transacional suportados AWS Glue e as permissões do Lake Formation. Lake Formation impõe essas permissões para AWS Glue operações.


**Formatos de tabela compatíveis**  

| Formato da tabela | Descrição e operações permitidas | Permissões do Lake Formation suportadas em AWS Glue | 
| --- | --- | --- | 
|  Apache Hudi  |  Um formato de tabela aberta usado para simplificar o processamento incremental de dados e o desenvolvimento de pipelines de dados.  Para exemplos, consulte [Usando a estrutura Hudi em AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-format-hudi.html).  |  As permissões em nível de tabela estão disponíveis para tabelas do Hudi. Para obter mais informações, consulte [Limitações](https://docs.aws.amazon.com/glue/latest/dg/security-lf-enable.html).  | 
|  Apache Iceberg  |  Um formato de tabela aberta que gerencia grandes coleções de arquivos como tabelas. Para obter exemplos, consulte [Usando a estrutura Iceberg em AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-format-iceberg.html).  |  AWS Glue a versão 5.0 e superior permite configurar controles de acesso em nível de tabela, linha, coluna e célula para consultas de leitura em suas tarefas do Apache Spark AWS Glue para tabelas Iceberg. Para obter mais informações, consulte [Limitações](https://docs.aws.amazon.com/glue/latest/dg/security-lf-enable.html).  | 
|  Linux Foundation Delta Lake  |  O Delta Lake é um projeto de código aberto que ajuda a implementar arquiteturas modernas de data lake, geralmente construídas no Amazon S3 ou no Sistema de Arquivos Distribuído do Hadoop (HDFS). Para ver exemplos, consulte [Usando a estrutura Delta Lake em AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-format-delta-lake.html).  |  As permissões em nível de tabela estão disponíveis para tabelas do Delta Lake. Para obter mais informações, consulte [Limitações](https://docs.aws.amazon.com/glue/latest/dg/security-lf-enable-considerations.html).  | 

## Recursos adicionais do
<a name="add-resources-glue"></a>

**Publicações em blogs e repositórios**
+ [Use o AWS Glue conector para ler e gravar tabelas Apache Iceberg com transações ACID e realizar viagens no tempo](https://aws.amazon.com/blogs/big-data/use-the-aws-glue-connector-to-read-and-write-apache-iceberg-tables-with-acid-transactions-and-perform-time-travel/)
+  [Escrevendo em tabelas do Apache Hudi usando conector personalizado AWS Glue](https://aws.amazon.com/blogs/big-data/writing-to-apache-hudi-tables-using-aws-glue-connector/)
+  AWS repositório do [modelo Cloudformation e amostra de código do pyspark](https://github.com/aws-samples/aws-glue-streaming-etl-with-apache-hudi) para analisar dados de streaming usando o Apache Hudi e o AWS Glue Amazon S3.