

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Processar exportações de dados
<a name="dataexports-processing"></a>

Nas seções a seguir, você encontrará informações sobre como processar as exportações de dados.

## Configurar o Amazon Athena
<a name="dataexports-athena"></a>

Ao contrário dos Relatórios de Custos e Uso (CURs), as exportações de dados não fornecem um arquivo SQL de configuração do Athena para consultar suas exportações. Você precisará usar um CloudFormation modelo para exportação de dados (consulte a opção 1) ou configurar manualmente o Athena (consulte a opção 2).

**(Opção 1) Use um CloudFormation modelo:** para localizar o CloudFormation modelo e as instruções para configurar o Athena com exportações de dados, consulte Exportações de dados [no Cloud Intelligence Dashboards](https://catalog.workshops.aws/awscid/en-US/data-exports) Framework.

**(Opção 2) Use um rastreador AWS Glue para criar sua tabela e partições para o Athena:** ao criar exportações de dados CUR ou de emissões de carbono para o Athena, sugerimos usar o formato de arquivo Apache Parquet; ele oferece melhor compactação e armazenamento orientado a colunas, o que contribui para consultas menores e mais baratas do Athena. A preferência de entrega de substituição é necessária para que cada partição mensal sempre contenha apenas uma cópia de cada arquivo e nenhum item de linha duplicado apareça quando você executar consultas com o Amazon Athena.

Também recomendamos usar o AWS Glue com um rastreador Glue para carregar seus dados no Athena.

**Para criar uma tabela e partições para o Athena usando um AWS rastreador Glue**

1. Crie uma exportação do CUR 2.0 ou de emissões de carbono com as seguintes opções de entrega de exportação de dados:
   + Tipo de compactação e formato de arquivo: Parquet - Parquet
   + Versionamento de arquivo: substituir o arquivo de exportação de dados existente

1. No Athena, use o editor do notebook com o Trino SQL e escolha **Create para criar** uma tabela com "AWS Glue crawler”. Usando o fluxo de trabalho do crawler Glue, aponte o crawler Glue para ser executado na pasta s3://<bucket-name>/<prefix>/<export-name>/data para carregar automaticamente todas as partições entregues para a exportação especificada no Athena.

1. Depois que o crawler Glue estiver concluído, você poderá usar o Athena para escrever consultas na tabela criada pelo crawler Glue.

## Configurar o Amazon Redshift
<a name="dataexports-redshift"></a>

O Amazon Redshift é um data warehouse na nuvem que pode ser acessado em uma capacidade provisionada ou em um modelo sem servidor. O Amazon Redshift oferece performance rápida de consultas para processar os dados pelo Data Exports.

No momento, o Data Exports não fornece o arquivo SQL de configuração do Redshift para consultar as exportações, como fazem os relatórios de custos e uso (CURs). No entanto, ainda é possível configurar manualmente o Redshift para consultar as exportações. Recomendamos que você use a gzip/csv compactação e o formato de arquivo para o Redshift.

Para obter mais informações sobre como configurar o Redshift, consulte o *[Guia de conceitos básicos do Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/gsg/new-user-serverless.html)*.

## Consultas SQL recomendadas para processamento do CUR 2.0
<a name="dataexports-recommended-sql-queries"></a>

Depois de carregar seus dados de exportação do CUR 2.0 em uma ferramenta de análise de dados, como Amazon Athena ou Amazon Redshift, você pode processá-los para obter insights de custo e uso. AWS O Well-Architected Labs oferece uma biblioteca de consultas de CUR que você pode usar para processar o CUR. Para mais informações, consulte [AWS CUR Query Library](https://wellarchitectedlabs.com/cost-optimization/cur_queries/).

Observe as duas informações a seguir sobre consultas SQL:
+ As consultas SQL do Well-Architected Labs não funcionarão no campo de consulta de exportação de dados, porque o Data Exports não é compatível com agregações e com algumas das outras sintaxes SQL usadas nessas consultas.
+ As consultas SQL do Well-Architected Labs só funcionarão se você não tiver alterado os nomes padrão das colunas. Dependendo da consulta, talvez seja necessário consultar algumas das colunas do produto como colunas separadas usando o operador de ponto. Para obter mais informações, consulte [Data query–SQL query and table configurations](https://docs.aws.amazon.com/cur/latest/userguide/dataexports-data-query.html).

## Consultas SQL recomendadas para processamento das exportações de dados de emissões de carbono
<a name="carbon-emissions-sql-queries"></a>

Para saber o total de emissões de carbono por payer\$1account\$1id:

```
SELECT payer_account_id, SUM(total_mbm_emissions_value) AS total_emissions
FROM "ccft-data-exports"."ccft-data-exports-data" -- change to your table name
GROUP BY payer_account_id
ORDER BY total_emissions DESC;
```

Para saber o total de emissões de carbono por payer\$1account\$1id e por product\$1code:

```
SELECT payer_account_id, product_code, SUM(total_mbm_emissions_value) AS total_emissions
FROM "ccft-data-exports"."ccft-data-exports-data"-- change to your table name
GROUP BY payer_account_id, product_code
ORDER BY total_emissions DESC;
```

Para saber o total de emissões de carbono por payer\$1account\$1id e por region\$1code:

```
SELECT payer_account_id, region_code, SUM(total_mbm_emissions_value) AS total_emissions
FROM "ccft-data-exports"."ccft-data-exports-data" -- change to your table name
GROUP BY payer_account_id, region_code
ORDER BY total_emissions DESC;
```