# Conexión a Amazon Redshift en AWS Glue Studio
<a name="connecting-to-data-redshift"></a>

**nota**  
 Puede usar AWS Glue de Spark para leer y escribir en tablas en bases de datos de Amazon Redshift fuera de AWS Glue Studio. Para configurar Amazon Redshift con trabajos de AWS Glue mediante programación, consulte [Conexiones Redshift](aws-glue-programming-etl-connect-redshift-home.md). 

 AWS Glue proporciona soporte integrado para Amazon Redshift. AWS Glue Studio proporciona una interfaz visual para conectarse a Amazon Redshift, crear trabajos de integración de datos y ejecutarlos en el tiempo de ejecución de Spark sin servidor de AWS Glue Studio. 

**Topics**
+ [Creación de una conexión de Amazon Redshift](creating-redshift-connection.md)
+ [Crear un nodo de origen de Amazon Redshift](creating-redshift-source-node.md)
+ [Crear un nodo de destino de Amazon Redshift](creating-redshift-target-node.md)
+ [Opciones avanzadas](creating-redshift-connection-advanced-options.md)

# Creación de una conexión de Amazon Redshift
<a name="creating-redshift-connection"></a>

## Permisos necesarios
<a name="creating-redshift-connection-permissions"></a>

 Se necesitan permisos adicionales para usar clústeres de Amazon Redshift y entornos de Amazon Redshift sin servidor. Para obtener más información sobre cómo agregar permisos a los trabajos de ETL, consulte [Revisar los permisos de IAM necesarios para los](https://docs.aws.amazon.com/glue/latest/ug/setting-up.html#getting-started-min-privs-job) trabajos de ETL. 
+  redshift:DescribeClusters 
+  redshift-serverless:ListWorkgroups 
+  redshift-serverless:ListNamespaces 

## Descripción general
<a name="w2aac25c27c13c11b5"></a>

 Al agregar una conexión en Amazon Redshift, puede elegir una conexión de Amazon Redshift existente o crear una nueva al agregar un **origen de datos (nodo Redshift** en AWS Glue Studio). 

 AWS Glue es compatible tanto con clústeres de Amazon Redshift como con entornos de Amazon Redshift sin servidor. Al crear una conexión, los entornos de Amazon Redshift sin servidor muestran la etiqueta **sin servidor** junto a la opción de conexión. 

 Para obtener más información sobre cómo crear una conexión de Amazon Redshift, consulte [Mover datos desde y hacia Amazon Redshift](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-redshift.html#aws-glue-programming-etl-redshift-using). 

# Crear un nodo de origen de Amazon Redshift
<a name="creating-redshift-source-node"></a>

## Permisos necesarios
<a name="creating-redshift-source-node-permissions"></a>

 los trabajos de AWS Glue Studio que utilizan orígenes de datos de Amazon Redshift requieren permisos adicionales. Para obtener más información sobre cómo agregar permisos a los trabajos de ETL, consulte [Revisar los permisos de IAM necesarios para los](https://docs.aws.amazon.com/glue/latest/ug/setting-up.html#getting-started-min-privs-job) trabajos de ETL. 

 Se necesitan los siguientes permisos para utilizar una conexión de Amazon Redshift. 
+  redshift-data:ListSchemas 
+  redshift-data:ListTables 
+  redshift-data:DescribeTable 
+  redshift-data:ExecuteStatement 
+  redshift-data:DescribeStatement 
+  redshift-data:GetStatementResult 

## Agregar un origen de datos de Amazon Redshift
<a name="creating-redshift-source-node-add"></a>

**Para agregar un nodo de **Origen de datos: Amazon Redshift**:**

1.  Elija el tipo de acceso a Amazon Redshift: 
   +  Conexión de datos directa (recomendada): elija esta opción si desea acceder a sus datos de Amazon Redshift directamente. Esta es la opción recomendada y también la predeterminada. 
   +  Data Catalog tables— Elija esta opción si hay tablas del catálogo de datos que desee utilizar. 

1.  Si elige Conexión de datos directa, elija la conexión para el origen de datos de Amazon Redshift. Esto supone que la conexión ya existe y que puede seleccionar entre las conexiones existentes. Si necesita crear una conexión, elija **Crear conexión de Redshift**. Para más información, consulte [Información general sobre el uso de conectores y conexiones](https://docs.aws.amazon.com/glue/latest/ug/connectors-chapter.html#using-connectors-overview). 

    Una vez que haya elegido una conexión, puede ver las propiedades de la conexión mediante un clic en **Ver propiedades**. La información sobre la conexión está visible, como la URL, los grupos de seguridad, la subred, la zona de disponibilidad, la descripción y las marcas horarias creadas (UTC) y actualizadas por última vez (UTC). 

1.  Elija una opción de origen de Amazon Redshift: 
   +  **Elija una sola tabla**: esta es la tabla que contiene los datos a los que desea acceder desde una sola tabla de Amazon Redshift. 
   +  **Ingresar una consulta personalizada**: permite acceder a un conjunto de datos de varias tablas de Amazon Redshift en función del consulta personalizada. 

1.  Si eligió una sola tabla, elija el esquema de Amazon Redshift. La lista de esquemas disponibles para elegir se determina por la tabla seleccionada. 

    O bien, elija **Ingresar consulta personalizada**. Elija esta opción para acceder a un conjunto de datos personalizado desde varias tablas de Amazon Redshift. Al elegir esta opción, ingrese la consulta de Amazon Redshift. 

    Al conectarse a un entorno de Amazon Redshift sin servidor, agregue el siguiente permiso a la consulta personalizada: 

   ```
               GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC
   ```

    Puede elegir **Deducir el esquema** para leer el esquema en función de la consulta que haya introducido. También puede elegir el **editor de consultas Open Redshift** para ingresar una consulta de Amazon Redshift. Para obtener más información, vea [Consulta de una base de datos mediante el editor de consultas](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor.html). 

1.  En **Rendimiento y seguridad**, elija el directorio provisional de Amazon S3 y el rol de IAM. 
   +  **Directorio de almacenamiento provisional de Amazon S3**: elija la ubicación de Amazon S3 para almacenar los datos temporalmente. 
   +  **Rol de IAM**: elija la función de IAM que pueda escribir en la ubicación de Amazon S3 que haya seleccionado. 

1.  En **Parámetros de Redshift personalizados (opcional),** ingrese el parámetro y el valor. 

# Crear un nodo de destino de Amazon Redshift
<a name="creating-redshift-target-node"></a>

## Permisos necesarios
<a name="creating-redshift-target-node-permissions"></a>

 los trabajos de AWS Glue Studio que utilizan los destinos de datos de Amazon Redshift requieren permisos adicionales. Para obtener más información sobre cómo agregar permisos a los trabajos de ETL, consulte [Revisar los permisos de IAM necesarios para los](https://docs.aws.amazon.com/glue/latest/ug/setting-up.html#getting-started-min-privs-job) trabajos de ETL. 

 Se necesitan los siguientes permisos para utilizar una conexión de Amazon Redshift. 
+  redshift-data:ListSchemas 
+  redshift-data:ListTables 

## Agregar un nodo de destino de Amazon Redshift
<a name="w2aac25c27c13c15b5"></a>

**Para crear de un nodo de destino de Amazon Redshift:**

1.  Elija una tabla Amazon Redshift existente como destino o ingrese un nombre de tabla nuevo. 

1.  Al utilizar el nodo **destino de datos: Redshift**, puede elegir entre las siguientes opciones: 
   +  **APPEND**: si ya existe una tabla, coloque todos los datos nuevos en la tabla como un inserto. Si la tabla no existe, créela y, a continuación, inserte todos los datos nuevos. 

      Además, seleccione la casilla si desea actualizar (UPSERT) los registros existentes en la tabla de destino. La tabla debe existir primero; de lo contrario, la operación fallará. 
   +  **MERGE**: AWS Glue actualizará o anexará datos a la tabla de destino en función de las condiciones que especifique. 
**nota**  
 Para utilizar la acción de combinación en AWS Glue, debe activar la función de combinación de Amazon Redshift. Para obtener instrucciones sobre cómo habilitar la combinación en una instancia de Amazon Redshift, consulte [MERGE (vista previa)](https://docs.aws.amazon.com/redshift/latest/dg/r_MERGE.html). 

      Elija opciones: 
     + **Elegir claves y acciones sencillas**: elija las columnas que se usarán como claves de coincidencia entre los orígenes de datos y el conjunto de destinos de datos. 

       Especifique las siguientes opciones cuando coincidan:
       + Actualice el registro del conjunto de datos de destino con los datos de origen.
       + Elimine el registro del conjunto de datos de destino.

       Especifique las siguientes opciones cuando no coincidan:
       + Inserte los datos de origen como una nueva fila en el conjunto de datos de destino.
       + No hacer nada.
     + **Ingrese una instrucción MERGE personalizada**: a continuación, puede elegir **Validar la instrucción MERGE** para comprobar si la instrucción es válida o no.
   +  **TRUNCATE**: si ya existe una tabla, trunque los datos de la tabla al borrar primero el contenido de la tabla de destino. Si el truncado se realiza correctamente, inserte todos los datos. Si la tabla no existe, créela y, a continuación, inserte todos los datos. Si el truncado no es exitoso, la operación producirá un error. 
   +  **DROP**: si una tabla ya existe, elimine los metadatos y los datos de la tabla. Si el borrado se realiza correctamente, inserte todos los datos. Si la tabla no existe, créela y, a continuación, inserte todos los datos. Si el descarte no es exitoso, la operación producirá un error. 
   +  **CREATE**: cree una tabla nueva con el nombre predeterminado. Si el nombre de la tabla ya existe, cree una nueva tabla con un sufijo de nombre `job_datetime` en el nombre para que sea único. Esto insertará todos los datos en la nueva tabla. Si la tabla existe, el nombre final de la tabla tendrá el sufijo adjunto. Si la tabla no existe, se creará una tabla. En cualquier caso, se creará una tabla nueva. 

# Opciones avanzadas
<a name="creating-redshift-connection-advanced-options"></a>

 Consulte [Uso del conector Spark de Amazon Redshift en AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-redshift.html#aws-glue-programming-etl-redshift-using).