

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Consideraciones y limitaciones al utilizar el conector de Spark
<a name="emr-spark-redshift-considerations"></a>

El conector Spark admite diversas formas de administrar las credenciales, configurar la seguridad y conectarse con otros AWS servicios. Familiarícese con las recomendaciones de esta lista para configurar una conexión funcional y resiliente.
+ Recomendamos activar SSL para la conexión JDBC desde Spark en Amazon EMR a Amazon Redshift.
+ Le recomendamos que administre las credenciales del clúster de Amazon Redshift en AWS Secrets Manager como práctica recomendada. Consulte [Utilización AWS Secrets Manager para recuperar credenciales para conectarse a Amazon Redshift](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-redshift-secrets.html) para ver un ejemplo.
+ Le recomendamos que pase un rol de IAM con el parámetro `aws_iam_role` para el parámetro de autenticación de Amazon Redshift.
+ Actualmente, el parámetro `tempformat` no admite el formato Parquet.
+ El URI `tempdir` apunta a una ubicación de Amazon S3. Este directorio temporal no se limpia automáticamente y, por lo tanto, podría agregar costos adicionales.
+ Tenga en cuenta las siguientes recomendaciones para Amazon Redshift:
  + Le recomendamos que bloquee el acceso público al clúster de Amazon Redshift.
  + Le recomendamos que active el [registro de auditoría de Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/db-auditing.html).
  + Recomendamos activar el [cifrado en reposo de Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/security-server-side-encryption.html).
+ Tenga en cuenta las siguientes recomendaciones para Amazon S3:
  + Recomendamos [bloquear el acceso público a los buckets de Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/access-control-block-public-access.html).
  + Recomendamos utilizar el [cifrado del servidor de Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/serv-side-encryption.html) para cifrar los buckets de Amazon S3 que utilice.
  + Recomendamos utilizar las [políticas de ciclo de vida de Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html) para definir las reglas de retención del bucket de S3.
  + Amazon EMR siempre verifica el código importado desde el código abierto a la imagen. Por motivos de seguridad, no admitimos la codificación de claves de AWS acceso en el `tempdir` URI como método de autenticación de Spark a Amazon S3.

Para obtener más información sobre el uso del conector y sus parámetros compatibles, consulte los siguientes recursos:
+ [Integración de Amazon Redshift para Apache Spark](https://docs.aws.amazon.com/redshift/latest/mgmt/spark-redshift-connector.html) en la *Guía de administración de Amazon Redshift*
+ [Repositorio comunitario de `spark-redshift`](https://github.com/spark-redshift-community/spark-redshift#readme) en GitHub