O Amazon Redshift não permitirá mais a criação de UDFs do Python a partir do Patch 198. As UDFs do Python existentes continuarão a funcionar normalmente até 30 de junho de 2026. Para ter mais informações, consulte a [publicação de blog ](https://aws.amazon.com/blogs/big-data/amazon-redshift-python-user-defined-functions-will-reach-end-of-support-after-june-30-2026/). 

# Conceitos básicos de data warehouses provisionados do Amazon Redshift
<a name="new-user"></a>

Se estiver usando o Amazon Redshift pela primeira vez, recomendamos que leia as seções a seguir que ajudarão a começar a usar clusters provisionados. O fluxo básico do Amazon Redshift é criar recursos provisionados, conectar-se ao Amazon Redshift, carregar dados de amostra e executar consultas nos dados. Neste guia, você pode escolher carregar dados de amostra do Amazon Redshift ou de um bucket do Amazon S3. Os dados de amostra são usados em toda a documentação do Amazon Redshift para demonstrar os recursos.

 Este tutorial demonstra como usar clusters provisionados pelo Amazon Redshift, que são objetos de data warehouse da AWS para os quais você gerencia recursos do sistema. Você também pode usar o Amazon Redshift com grupos de trabalho sem servidor, que são objetos de data warehouse que escalam automaticamente em resposta ao uso. Para começar a usar o Redshift sem servidor, consulte [Conceitos básicos de data warehouse do Amazon Redshift sem servidorConceitos básicos de data warehouses de tecnologia sem servidor](new-user-serverless.md).

Depois de criar e fazer login no console provisionado do Amazon Redshift, você poderá criar e gerenciar objetos do Amazon Redshift, inclusive clusters, nós e bancos de dados. Você também poderá executar e visualizar consultas, além de outras operações de linguagem de definição de dados (DDL) e de linguagem de manipulação de dados (DML) SQL.

**Importante**  
O cluster provisionado para este exercício é executado em um ambiente ativo. Enquanto estiver em execução, ele vai acumular cobranças na Conta da AWS. Para obter informações sobre preço, consulte [a página de preço do Amazon Redshift](https://aws.amazon.com//redshift/pricing/).  
Para evitar cobranças desnecessárias, exclua seu cluster quando terminar de usá-lo. A seção final deste capítulo explica como fazer isso.

Faça login no Console de gerenciamento da AWS e abra o console do Amazon Redshift em [https://console.aws.amazon.com/redshiftv2/](https://console.aws.amazon.com/redshiftv2/).

Recomendamos que você comece acessando o **Painel de clusters provisionado** para começar a usar o console do Amazon Redshift. 

Dependendo da configuração, os seguintes itens aparecem no painel de navegação do console provisionado do Amazon Redshift:
+ **Redshift sem servidor**: acesse e analise dados sem a necessidade de configurar, ajustar e gerenciar clusters provisionados do Amazon Redshift.
+ **Painel de clusters provisionado**: veja a lista de clusters na Região da AWS, confira as **Métricas de cluster** e a **Visão geral da consulta** para ter insights sobre dados de métricas (como utilização da CPU) e informações de consulta. Usá-los pode ajudar você a determinar se seus dados de performance são anormais em um intervalo de tempo especificado.
+ **Clusters**: veja a lista de clusters nessa Região da AWS, escolha um cluster para iniciar a consulta ou realize ações relacionadas ao cluster. Também é possível criar um novo cluster a partir desta página.
+ **Editor de consultas**: execute consultas em bancos de dados hospedados no cluster do Amazon Redshift. Em vez disso, recomendamos usar o **Editor de Consultas v2**.
+ **Editor de Consultas v2**: o Editor de Consultas do Amazon Redshift v2 é uma aplicação de cliente SQL separada, baseada na web, para criar e executar consultas no data warehouse do Amazon Redshift. Você pode visualizar seus resultados em gráficos e compartilhar suas consultas com outras pessoas de sua equipe.
+ **Queries and loads** (Consultas e cargas): obtenha informações para referência ou solução de problemas, como uma lista de consultas recentes e o texto SQL de cada consulta.
+ **Datashares** (Unidades de compartilhamento de dados): como administrador de uma conta de produtor, autorize contas de consumidor a acessar unidades de compartilhamento de dados ou escolha não autorizar o acesso. Para usar uma unidade de compartilhamento de dados autorizada, um administrador de conta de consumidor pode associá-la a toda uma Conta da AWS ou especificar namespaces de cluster em uma conta. Um administrador também pode recusar uma unidade de compartilhamento de dados.
+ **Integrações ETL zero**: gerencie integrações que disponibilizam dados transacionais no Amazon Redshift depois de serem gravados em fontes compatíveis.
+ **Conexões do Centro de Identidade do IAM**: configure a conexão entre o Amazon Redshift e o Centro de Identidade do IAM.
+ **Configurations** (Configurações): conecte-se a clusters do Amazon Redshift por meio de ferramentas de cliente SQL em conexões JDBC (Java Database Connectivity) e ODBC (Open Database Connectivity). Também é possível configurar um endpoint da Virtual Private Cloud (VPC) gerenciado pelo Amazon Redshift. Isso fornece uma conexão privada entre uma VPC com base no serviço da Amazon VPC que contém um cluster e outra VPC que está executando uma ferramenta cliente. 
+ **Integração de parceiro da AWS**: crie integração com um parceiro da AWS compatível.
+ **Advisor** (Consultor): obtenha recomendações específicas sobre as alterações que você pode fazer em seu cluster do Amazon Redshift para priorizar suas otimizações.
+ **AWS Marketplace**: obtenha informações sobre outras ferramentas ou serviços da AWS que funcionam com o Amazon Redshift.
+ **Alarms** (Alarmes): crie alarmes em métricas de cluster para exibir dados de performance e rastrear métricas durante um período especificado.
+ **Events** (Eventos): monitore eventos e receba relatórios sobre informações como a data em que o evento ocorreu, uma descrição ou a origem do evento.
+ **What's new** (Novidades): veja os novos recursos e as atualizações de produtos do Amazon Redshift.

Neste tutorial, você realizará as seguintes etapas:

![As etapas neste tutorial, descritas a seguir](http://docs.aws.amazon.com/pt_br/redshift/latest/gsg/images/getting-started-bring-own-data.png)


**Topics**
+ [Como se cadastrar na AWS](#provisioned-prereq-signup)
+ [Determinar regras de firewall](#rs-gsg-prereq-firewall-rules)
+ [Etapa 1: Criar um cluster de amostra do Amazon Redshift](#rs-gsg-launch-sample-cluster)
+ [Etapa 2: Configurar regras de entrada para clientes SQL](#rs-gsg-authorize-cluster-access)
+ [Etapa 3: Conceder acesso a um cliente SQL e executar consultas](#rs-gsg-connect-to-cluster)
+ [Etapa 4: Carregar dados do Amazon S3 para o Amazon Redshift](#rs-gsg-create-sample-db)
+ [Etapa 5: Experimentar exemplo de consultas usando o editor de consultas](#rs-gsg-try-query)
+ [Etapa 6: Redefinir o ambiente](#rs-gsg-clean-up-tasks)

## Como se cadastrar na AWS
<a name="provisioned-prereq-signup"></a>

Caso você ainda não tenha uma Conta da AWS, cadastre-se. Se você já tem uma conta, pode pular esse pré-requisito e usar sua conta existente.

1. Abra [https://portal.aws.amazon.com/billing/signup](https://portal.aws.amazon.com/billing/signup).

1. Siga as instruções online.

   Parte do procedimento de inscrição envolve receber uma chamada telefônica ou uma mensagem de texto e inserir um código de verificação pelo teclado do telefone.

   Quando você se inscreve para uma Conta da AWS, um *Usuário raiz da conta da AWS* é criado. O usuário-raiz tem acesso a todos os Serviços da AWS e recursos na conta. Como prática recomendada de segurança, atribua o acesso administrativo a um usuário e use somente o usuário-raiz para executar [tarefas que exigem acesso de usuário-raiz](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_root-user.html#root-user-tasks).

## Determinar regras de firewall
<a name="rs-gsg-prereq-firewall-rules"></a>

**nota**  
Este tutorial pressupõe que o cluster use a porta padrão 5439 e que o Editor de Consultas do Amazon Redshift v2 possa ser usado para executar comandos SQL. Ele não entra em detalhes sobre as configurações de rede nem sobre a configuração de um cliente SQL que possa ser necessário no ambiente.

Em alguns ambientes, você deve especificar uma porta ao iniciar o cluster do Amazon Redshift. Você usa essa porta com o URL do endpoint do cluster para acessar o cluster. Você também criará uma regra de entrada em um grupo de segurança para conceder acesso ao cluster por meio da porta.

Se o seu computador cliente estiver atrás de um firewall, verifique se você conhece uma porta aberta que pode ser usada. Essa porta aberta permite que você se conecte ao cluster a partir de uma ferramenta de cliente SQL e execute consultas. Se você não souber isso, trabalhe com alguém que entenda as regras de firewall da rede para determinar uma porta aberta em seu firewall. 

Embora o Amazon Redshift use a porta 5439 por padrão, a conexão não funcionará se essa porta não estiver aberta no firewall. Não é possível alterar o número da porta do cluster do Amazon Redshift depois que ela é criada. Portanto, certifique-se de especificar uma porta que funciona em seu ambiente durante o processo de inicialização.

## Etapa 1: Criar um cluster de amostra do Amazon Redshift
<a name="rs-gsg-launch-sample-cluster"></a>

Neste tutorial, você acompanhará o processo para criar um cluster do Amazon Redshift com um banco de dados. Depois, você carregará um conjunto de dados do Amazon S3 em tabelas do banco de dados. Você pode usar esse cluster para avaliar o serviço do Amazon Redshift.

Antes de começar a configurar um cluster do Amazon Redshift, não se esqueça de cumprir todos os pré-requisitos necessários, como [Como se cadastrar na AWS](#provisioned-prereq-signup) e [Determinar regras de firewall](#rs-gsg-prereq-firewall-rules).

Para qualquer operação que acesse dados de outro recurso da AWS, seu cluster precisa de permissão para acessar o recurso e os dados no recurso em seu nome. Um exemplo é o uso de um comando SQL COPY para carregar dados do Amazon Simple Storage Service (Amazon S3). Você concede essas permissões usando o AWS Identity and Access Management (IAM). É possível fazer isso por meio de um perfil do IAM criado e associado ao cluster. Para ter mais informações sobre credenciais e permissões de acesso, consulte [Credenciais e permissões de acesso](https://docs.aws.amazon.com/redshift/latest/dg/loading-data-access-permissions.html) no *Guia do desenvolvedor de banco de dados do Amazon Redshift*.

**Para criar um cluster do Amazon Redshift.**

1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon Redshift em [https://console.aws.amazon.com/redshiftv2/](https://console.aws.amazon.com/redshiftv2/).
**Importante**  
Se você usar credenciais de usuário do IAM, verifique se o usuário tem as permissões necessárias para realizar as operações de cluster. Para ter mais informações, consulte [Segurança no Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/iam-redshift-user-mgmt.html) no *Guia de gerenciamento do Amazon Redshift*.

1. No Console da AWS, escolha a Região da AWS onde você deseja criar o cluster. 

1. No menu de navegação, escolha **Clusters** e **Create cluster** (Criar cluster). A página **Create cluster (Criar cluster)** é exibida.

1. Na seção **Configuração do cluster**, especifique valores para o **Identificador de cluster**, o **Tipo de nó**, e os **Nós**: 
   + **Identificador de cluster**: digite **examplecluster** para este tutorial. Esse identificador deve ser exclusivo. O identificador deve ter entre 1 e 63 caracteres usando como caracteres válidos a-z (somente minúsculas) e - (hífen). 
   + Escolha um dos seguintes métodos para dimensionar o cluster:
**nota**  
A etapa a seguir pressupõe uma Região da AWS que comporte tipos de nó RA3. Para conferir a lista de Regiões da AWS compatíveis com tipos de nó RA3, consulte [Visão geral dos tipos de nó RA3](https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html#rs-ra3-node-types) no *Guia de gerenciamento do Amazon Redshift*. Para saber mais sobre as especificações de cada tipo e tamanho de nó, consulte [Detalhes do tipo de nó](https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html#rs-node-type-info).
     + Se você não souber o tamanho do cluster, escolha **Ajude-me a escolher**. Isso abre uma calculadora de dimensionamento que faz perguntas sobre o tamanho e as características da consulta dos dados que você planeja armazenar no data warehouse. 

       Se você souber o tamanho necessário do cluster (ou seja, o tipo de nó e o número de nós), escolha **Eu escolherei**. Em seguida, escolha o **Node type** (Tipo de nó) e número de **Nodes** (Nós) para dimensionar seu cluster para a prova de conceito.

       Para este tutorial, escolha **ra3.4xlarge** em **Tipo de nó** e **2** em **Número de nós**.

       Se uma opção para a **Configuração AZ** estiver disponível, selecione **Single-AZ**.
     + Para usar o conjunto de dados de amostra que o Amazon Redshift fornece, em **Dados de amostra**, escolha **Carregar dados de amostra**. O Amazon Redshift carrega o Tickit do conjunto de dados de amostra para o banco de dados `dev` padrão e o esquema `public`.

1. Na seção **Configuração do banco de dados**, especifique um valor para **Nome do usuário administrador**. Em **Senha do administrador**, escolha uma das seguintes opções:
   +  **Gere uma senha**: use uma senha gerada pelo Amazon Redshift. 
   +  **Adicionar manualmente uma senha de administrador**: use a própria senha. 
   +  **Gerenciar credenciais de administrador no AWS Secrets Manager**: o Amazon Redshift usa AWS Secrets Manager para gerar e gerenciar a senha de administrador. O uso do AWS Secrets Manager para gerar e gerenciar o segredo da senha incorre em uma taxa. Para obter informações sobre definição de preços do AWS Secrets Manager, consulte [Definição de preços do AWS Secrets Manager](https://aws.amazon.com/secrets-manager/pricing/). 

   Para este tutorial, use estes valores:
   + **Nome do usuário administrador**: digite **awsuser**.
   + **Senha do usuário administrador**: insira **Changeit1** para a senha.

1. Para este tutorial, crie uma função do IAM e a defina como padrão para o cluster, conforme descrito a seguir. Só pode haver um conjunto de funções do IAM padrão por cluster. 

   1. Em **Cluster permissions** (Permissões de cluster), em **Manage IAM roles** (Gerenciar funções do IAM), escolha **Create IAM role** (Criar função do IAM).

   1. Especifique um bucket do Amazon S3 para que a função do IAM seja acessada por um destes métodos:
      + Escolha **No additional Amazon S3 bucket** (Nenhum bucket adicional do Amazon S3) para permitir que a função do IAM criada acesse somente os buckets do Amazon S3 que são nomeados como `redshift`.
      + Selecione **Any Amazon S3 bucket** (Qualquer bucket do Amazon S3) para permitir que a função do IAM criada acesse todos os buckets do Amazon S3. 
      + Escolha **Specific Amazon S3 buckets** (Buckets específicos do Amazon S3) para especificar um ou mais buckets do Amazon S3 para que a função do IAM acesse. Em seguida, escolha um ou mais buckets do Amazon S3 na tabela.

   1. Escolha **Create IAM role as default** (Criar função do IAM como padrão). O Amazon Redshift cria e define automaticamente a função do IAM como padrão para o cluster.

      Como você criou sua função do IAM pelo console, ela tem a política `AmazonRedshiftAllCommandsFullAccess` anexada. Isso permite que o Amazon Redshift copie, carregue, consulte e analise dados de recursos da Amazon em sua conta do IAM. 

   Para ter informações sobre como gerenciar o perfil padrão do IAM para um cluster, consulte [Criar uma função do IAM como padrão para o Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/default-iam-role.html) no *Guia de gerenciamento do Amazon Redshift*.

1. (Opcional) Na seção **Configurações adicionais**, desative **Usar padrões** para modificar as configurações **Rede e segurança**, **Configuração do banco de dados**, **Manutenção**, **Monitoramento** e **Backup**.

   Em alguns casos, você pode criar o cluster com a opção **Load sample data** (Carregar dados de exemplo) e ativar o roteamento aprimorado da Amazon VPC. Se for o caso, o cluster de sua Virtual Private Cloud (VPC) precisa acessar o endpoint do Amazon S3 para que os dados sejam carregados. 

   Há dois métodos para tornar o cluster acessível ao público. Configure um endereço de conversão de endereço de rede (NAT) em sua VPC para que o cluster acesse a Internet. Ou configure um endpoint da VPC do Amazon S3 em sua VPC. Para ter mais informações sobre o roteamento aprimorado da Amazon VPC, consulte [Enhanced VPC routing](https://docs.aws.amazon.com/redshift/latest/mgmt/enhanced-vpc-enabling-cluster.html) no *Guia de gerenciamento do Amazon Redshift*. 

1. Selecione **Criar cluster**. Aguarde até que o cluster seja criado com o status `Available` na página **Clusters**.

## Etapa 2: Configurar regras de entrada para clientes SQL
<a name="rs-gsg-authorize-cluster-access"></a>

**nota**  
Recomendamos que você ignore esta etapa e acesse o cluster usando o Editor de Consultas do Amazon Redshift v2.

Mais adiante neste tutorial, você acessará seu cluster de dentro de uma nuvem privada virtual (VPC) com base no serviço da Amazon VPC. No entanto, se você usar um cliente SQL de fora do firewall para acessar o cluster, certifique-se de conceder acesso de entrada. 

**Para verificar o firewall e conceder acesso de entrada a seu cluster**

1. Verifique as regras do firewall quando seu cluster precisar ser acessado de fora de um firewall. Por exemplo, seu cliente pode ser uma instância do Amazon Elastic Compute Cloud (Amazon EC2) ou um computador externo. 

   Consulte mais informações sobre regras de firewall em [Regras de grupos de segurança](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/security-group-rules.html) no *Guia do usuário do Amazon EC2*.

1. Para acessar de um cliente externo Amazon EC2, adicione uma regra de entrada ao grupo de segurança anexado ao seu cluster que permite o tráfego de entrada. Adicione regras de grupo de segurança do Amazon EC2 no console do Amazon EC2. Por exemplo, um CIDR/IP de 192.0.2.0/24 permite que os clientes nesse endereço IP se conectem ao seu cluster. Descubra o CIDR/IP correto para o seu ambiente.

## Etapa 3: Conceder acesso a um cliente SQL e executar consultas
<a name="rs-gsg-connect-to-cluster"></a>

Para consultar bancos de dados hospedados pelo cluster do Amazon Redshift, há algumas opções para clientes SQL. Isso inclui:
+ Conecte-se ao cluster e execute consultas usando o Editor de Consultas do Amazon Redshift v2.

  Se você usar o Editor de Consultas v2, não precisará baixar e configurar uma aplicação de cliente SQL. Você pode iniciar o Editor de Consultas do Amazon Redshift v2 por meio do console do Amazon Redshift.
+ Conecte-se ao cluster usando RSQL. Para ter mais informações, consulte [Conectar-se com o Amazon Redshift RSQL](https://docs.aws.amazon.com/redshift/latest/mgmt/rsql-query-tool.html) no *Guia de gerenciamento do Amazon Redshift*.
+ Conecte-se ao cluster por meio de uma ferramenta de cliente SQL, como o SQL Workbench/J. Para ter mais informações, consulte [Conectar-se com SQL Workbench/J](https://docs.aws.amazon.com/redshift/latest/mgmt/connecting-using-workbench.html) no *Guia de gerenciamento do Amazon Redshift*.

Este tutorial usa o Editor de Consultas do Amazon Redshift v2 como um método fácil para executar consultas em bancos de dados hospedados pelo cluster do Amazon Redshift. Após a criação do cluster, é possível executar consultas imediatamente. Para ter detalhes sobre as considerações ao usar o Editor de Consultas do Amazon Redshift v2, consulte [Considerações ao trabalhar com o editor de consultas v2](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-using.html#query-editor-v2-considerations) no *Guia de gerenciamento do Amazon Redshift*.

### Conceder acesso ao editore de consultas v2
<a name="gsg-query-cluster-configure-v2"></a>

Na primeira vez que um administrador configura o editor de consultas v2 para sua Conta da AWS, ele escolhe a AWS KMS key que será usada para criptografar recursos do editor de consultas v2. Os recursos do Editor de Consultas do Amazon Redshift v2 incluem consultas, cadernos e gráficos salvos. Por padrão, uma chave de propriedade da AWS é usada para criptografar recursos. Como alternativa, um administrador pode usar uma chave gerenciada pelo cliente escolhendo o nome do recurso da Amazon (ARN) da chave na página de configuração. Depois que você configurar uma conta, as configurações de criptografia do AWS KMS não poderão ser alteradas. Para ter mais informações, consulte [Configurar sua Conta da AWS](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-getting-started.html) no *Guia de gerenciamento do Amazon Redshift*.

Para acessar o editor de consultas v2, é necessário ter permissão. Um administrador pode associar uma das políticas gerenciadas pela AWS para o Editor de Consultas do Amazon Redshift v2 ao usuário ou perfil do IAM para conceder permissões. Essas políticas gerenciadas pela AWS são redigidas com diferentes opções que controlam como os recursos de marcação permitem o compartilhamento de consultas. Você pode usar o console do IAM ([https://console.aws.amazon.com/iam/](https://console.aws.amazon.com/iam/)) para anexar políticas do IAM. Consulte mais informações sobre essas políticas em [Acessar o editor de consultas v2](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-getting-started.html#query-editor-v2-configure) no *Guia de gerenciamento do Amazon Redshift*.

Você também pode criar sua própria política com base nas permissões concedidas e negadas nas políticas gerenciadas fornecidas. Se usar o editor de políticas de console do IAM para criar sua própria política, escolha **SQL Workbench** como o serviço para o qual você está criando a política no editor visual. O editor de consultas v2 usa o nome do serviço AWS SQL Workbench no editor visual e no IAM Policy Simulator.

Para obter mais informações, consulte [Trabalhar com o editor de consultas v2](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-using.html#query-editor-v2-configure) no *Guia de gerenciamento do Amazon Redshift*.

## Etapa 4: Carregar dados do Amazon S3 para o Amazon Redshift
<a name="rs-gsg-create-sample-db"></a>

Depois de criar o cluster, você poderá carregar dados do Amazon S3 nas tabelas do banco de dados. Há várias maneiras de carregar dados do Amazon S3. 
+ É possível usar um cliente SQL para executar o comando SQL CREATE TABLE e criar uma tabela no banco de dados e, depois, usar o comando SQL COPY para carregar dados do Amazon S3. O Editor de Consultas do Amazon Redshift v2 é um cliente SQL.
+ É possível usar o assistente de carregamento do Editor de Consultas do Amazon Redshift v2.

Este tutorial demonstra como usar o Editor de Consultas V2 do Amazon Redshift para executar comandos SQL para CRIAR tabelas e COPIAR dados. Inicie o **Editor de Consultas v2** no painel de navegação do console do Amazon Redshift. No Editor de Consultas v2, crie uma conexão com o cluster `examplecluster` e o banco de dados denominado `dev` com o usuário administrador `awsuser`. Para este tutorial, escolha **Credenciais temporárias usando um nome de usuário do banco de dados** ao criar a conexão. Para ter detalhes sobre como usar o Editor de Consultas do Amazon Redshift, v2, consulte [Conectar-se a um banco de dados do Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-using.html#query-editor-v2-connecting) no *Guia de gerenciamento do Amazon Redshift*.

### Carregar dados do Amazon S3 usando comandos SQL
<a name="gsg-load-sample-data-v1"></a>

No painel de edição de consultas do Editor de Consultas v2, confirme que você já se conectou com o cluster `examplecluster` e o banco de dados `dev`. Depois, crie tabelas no banco de dados e carregue dados nelas. Para este tutorial, os dados carregados estão disponíveis em um bucket do Amazon S3, acessível por meio de várias Regiões da AWS.

O procedimento a seguir cria tabelas e carrega dados de um bucket público do Amazon S3.

Use o Editor de Consultas do Amazon Redshift v2 para copiar e executar a declaração de criação de tabelas e criar uma tabela no esquema `public` do banco de dados `dev`. Para obter mais informações sobre a sintaxe, consulte [CREATE TABLE](https://docs.aws.amazon.com/redshift/latest/dg/r_CREATE_TABLE_NEW.html) no *Guia do desenvolvedor de banco de dados do Amazon Redshift*.

**Como criar e carregar dados usando um cliente SQL, como o Editor de Consultas v2**

1. Execute o comando SQL a seguir para CRIAR a tabela `sales`.

   ```
      drop table if exists sales;
      create table sales(
   	salesid integer not null,
   	listid integer not null distkey,
   	sellerid integer not null,
   	buyerid integer not null,
   	eventid integer not null,
   	dateid smallint not null sortkey,
   	qtysold smallint not null,
   	pricepaid decimal(8,2),
   	commission decimal(8,2),
   	saletime timestamp);
   ```

1. Execute o comando SQL a seguir para CRIAR a tabela `date`.

   ```
   drop table if exists date;              
   create table date(
   	dateid smallint not null distkey sortkey,
   	caldate date not null,
   	day character(3) not null,
   	week smallint not null,
   	month character(5) not null,
   	qtr character(5) not null,
   	year smallint not null,
   	holiday boolean default('N'));
   ```

1. Carregue a tabela `sales` do Amazon S3 usando o comando COPY.
**nota**  
Recomendamos usar o comando COPY para carregar grandes conjuntos de dados no Amazon Redshift por meio do Amazon S3. Para obter mais informações sobre sintaxe de COPY, consulte [COPY](https://docs.aws.amazon.com/redshift/latest/dg/r_COPY.html) no *Guia do desenvolvedor de banco de dados do Amazon Redshift*.

   Forneça autenticação ao seu cluster para acessar o Amazon S3 em seu nome para carregar os dados de amostra. Você pode oferecer autenticação fazendo referência ao perfil do IAM criado e definido como `default` para o cluster ao escolher **Criar função do IAM como padrão** na criação do cluster.

   Carregue a tabela `sales` usando o comando SQL a seguir. Como alternativa, é possível baixar e visualizar os [dados de origem do Amazon S3 para a tabela `sales`](https://s3.amazonaws.com/redshift-downloads/tickit/sales_tab.txt). .

   ```
   COPY sales
       FROM 's3://redshift-downloads/tickit/sales_tab.txt' 
       DELIMITER '\t' 
       TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' 
       REGION 'us-east-1'
       IAM_ROLE default;
   ```

1. Carregue a tabela `date` usando o comando SQL a seguir. Como alternativa, é possível baixar e visualizar os [dados de origem do Amazon S3 para a tabela `date`](https://s3.amazonaws.com/redshift-downloads/tickit/date2008_pipe.txt). .

   ```
   COPY date
       FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' 
       DELIMITER '|' 
       REGION 'us-east-1'
       IAM_ROLE default;
   ```

### Carregar dados do Amazon S3 usando o Editor de Consultas v2
<a name="gsg-load-sample-data-v2"></a>

Esta seção descreve de que forma você carrega seus dados em um cluster do Amazon Redshift. O Editor de Consultas v2 simplifica o carregamento de dados ao usar o assistente **Carregar dados**. O comando COPY gerado e utilizado no assistente **Carregar dados** do Editor de Consultas v2 é compatível com muitos parâmetros disponíveis para a sintaxe do comando COPY para carregar dados do Amazon S3. Para obter informações sobre o comando COPY e suas opções usadas para copiar a carga do Amazon S3, consulte [COPY do Amazon Simple Storage Service](https://docs.aws.amazon.com/redshift/latest/dg/copy-parameters-data-source-s3.html) no *Guia do desenvolvedor do Amazon Redshift*.

Para carregar seus dados do Amazon S3 para o Amazon Redshift, o Amazon Redshift requer uma função do IAM que tenha os privilégios necessários para carregar dados do bucket do Amazon S3 especificado.

Para carregar seus dados do Amazon S3 para o Amazon Redshift, você pode usar o assistente de carregamento de dados do Editor de Consultas V2. Para ter informações sobre como usar o assistente de carregamento de dados, consulte [Carregar dados do Amazon S3](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-loading-data.html) no *Guia de gerenciamento do Amazon Redshift*. 

### Criar dados TICKIT no cluster
<a name="gsg-load-tickit-data-v2"></a>

O TICKIT é um banco de dados de exemplo que você pode carregar opcionalmente em seu cluster do Amazon Redshift com o objetivo de aprender a consultar dados no Amazon Redshift. É possível criar o conjunto completo de tabelas TICKIT e carregar dados no cluster das seguintes maneiras:
+ Ao criar um cluster no console do Amazon Redshift, você tem a opção de carregar dados TICKIT de exemplo simultaneamente. No console do Amazon Redshift, selecione **Clusters** e **Criar cluster**. Na seção **Dados de exemplo**, selecione **Carregar dados de exemplo**. O Amazon Redshift carregará automaticamente o conjunto de dados de exemplo para o banco de dados `dev` do cluster do Amazon Redshift durante a criação do cluster.
+ Para se conectar a um cluster existente, faça o seguinte:
  + No console do Amazon Redshift, no painel de navegação, selecione **Clusters**.
  + Escolha seu cluster no painel **Clusters**.
  + Escolha **Consultar dados** e **Consultar no Editor de Consultas v2**.
  + Expanda **examplecluster** na lista de recursos. Se esta for a primeira vez que você se conecta ao cluster, a opção **Conectar a examplecluster** é exibida. Escolha **Nome de usuário e senha do banco de dados**. Deixe o banco de dados como **dev**. Especifique **awsuser** para o nome de usuário e **Changeit1** para a senha.
  + Escolha **Criar conexão**.
+ Com o Editor de Consultas do Amazon Redshift v2, é possível carregar dados TICKIT em um banco de dados de exemplo chamado **sample\_data\_dev**. Escolha o banco de dados **sample\_data\_dev** na lista de recursos. Ao lado do nó **tickit**, escolha o ícone **Abrir cadernos de exemplo**. Confirme que você deseja criar o banco de dados de exemplo.
+ O Editor de Consultas do Amazon Redshift v2 cria o banco de dados de exemplo além de um caderno de exemplo chamado **tickit-sample-notebook**. Você pode escolher **Executar tudo** para executar esse caderno e consultar dados no banco de dados de exemplo.

Para visualizar detalhes sobre os dados TICKIT, consulte [Banco de dados de exemplo](https://docs.aws.amazon.com/redshift/latest/dg/c_sampledb.html) no *Guia do desenvolvedor de banco de dados do Amazon Redshift*.

## Etapa 5: Experimentar exemplo de consultas usando o editor de consultas
<a name="rs-gsg-try-query"></a>

Para configurar e usar o Editor de Consultas do Amazon Redshift v2 e consultar um banco de dados, confira [Trabalhar com o editor de consultas v2](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-using.html) no *Guia de gerenciamento do Amazon Redshift*.

Agora, tente alguns exemplos de consultas, como mostrado a seguir. Para criar consultas no Editor de Consultas V2, escolha o ícone **\+** no canto superior direito do painel de consulta e selecione **SQL**. Uma nova página de consulta é exibida, na qual você pode copiar e colar as consultas SQL a seguir.

**nota**  
Primeiro, você deve executar a primeira consulta no caderno, que define a configuração `search_path` do servidor para o esquema `tickit` usando o seguinte comando SQL:  

```
set search_path to tickit;
```

Para ter mais informações sobre como trabalhar com o comando SELECT, consulte [SELECT](https://docs.aws.amazon.com/redshift/latest/dg/r_SELECT_synopsis.html) no *Guia do desenvolvedor de banco de dados do Amazon Redshift*.

```
-- Get definition for the sales table.
SELECT *    
FROM pg_table_def    
WHERE tablename = 'sales';
```

```
-- Find total sales on a given calendar date.
SELECT sum(qtysold) 
FROM   sales, date 
WHERE  sales.dateid = date.dateid 
AND    caldate = '2008-01-05';
```

```
-- Find top 10 buyers by quantity.
SELECT firstname, lastname, total_quantity 
FROM   (SELECT buyerid, sum(qtysold) total_quantity
        FROM  sales
        GROUP BY buyerid
        ORDER BY total_quantity desc limit 10) Q, users
WHERE Q.buyerid = userid
ORDER BY Q.total_quantity desc;
```

```
-- Find events in the 99.9 percentile in terms of all time gross sales.
SELECT eventname, total_price 
FROM  (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile 
       FROM (SELECT eventid, sum(pricepaid) total_price
             FROM   sales
             GROUP BY eventid)) Q, event E
       WHERE Q.eventid = E.eventid
       AND percentile = 1
ORDER BY total_price desc;
```

## Etapa 6: Redefinir o ambiente
<a name="rs-gsg-clean-up-tasks"></a>

Nas etapas anteriores, você criou com êxito um cluster do Amazon Redshift, carregou dados em tabelas e consultou dados usando um cliente SQL, como o Editor de Consultas do Amazon Redshift v2.

Ao concluir este tutorial, sugerimos que você reconfigure seu ambiente para o estado anterior, excluindo seu cluster de amostra. Você continuará a ser cobrado pelo serviço do Amazon Redshift até excluir o cluster.

No entanto, convém manter o cluster de exemplo em execução se pretende experimentar tarefas em outros guias do Amazon Redshift ou tarefas descritas em [Executar comandos para definir e usar um banco de dados no data warehouse](database-tasks.md). 

**Para excluir um cluster**

1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon Redshift em [https://console.aws.amazon.com/redshiftv2/](https://console.aws.amazon.com/redshiftv2/).

1. No menu de navegação, escolha **Clusters** para exibir sua lista de clusters. 

1. Escolha o cluster `examplecluster`. Em **Ações**, escolha **Excluir**. A página **Delete examplecluster?** é exibida. 

1. Confirme o cluster a ser excluído, desmarque a configuração **Criar snapshot final** e insira **delete** para confirmar a exclusão. Escolha **Delete Cluster (Excluir cluster)**. 

Na página da lista de clusters, o status do cluster é atualizado uma vez que o cluster está excluído. 

Depois de concluir este tutorial, você pode encontrar mais informações sobre o Amazon Redshift e as próximas etapas em [Recursos adicionais para saber mais sobre o Amazon Redshift](additional-resources.md).