

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Diferentes formas de obtener datos en Amazon EMR
<a name="emr-plan-get-data-in"></a>

Amazon EMR proporciona varias formas de obtener datos en un clúster. La forma más común consiste en cargar los datos en Amazon S3 y utilizar las características integradas de Amazon EMR para cargar los datos en el clúster. También puede utilizar la característica DistributedCache de Hadoop para transferir archivos desde un sistema de archivos distribuido al sistema de archivos local. La implementación de Hive proporcionada por Amazon EMR (Hive versión 0.7.1.1 y posteriores) incluye la funcionalidad que puede utilizar para importar y exportar datos entre DynamoDB y un clúster de Amazon EMR. Si tiene una gran cantidad de datos on-premises para procesar, puede encontrar útil el servicio Direct Connect . 

**Topics**
+ [Descargar datos en Amazon S3](emr-plan-upload-s3.md)
+ [Cargue datos con AWS DataSync](emr-plan-upload-datasync.md)
+ [Importación de archivos con caché distribuida con Amazon EMR](emr-plan-input-distributed-cache.md)
+ [Detección y procesamiento de archivos comprimidos con Amazon EMR](HowtoProcessGzippedFiles.md)
+ [Importación de datos de DynamoDB a Hive con Amazon EMR](emr-plan-input-dynamodb.md)
+ [Conéctese a los datos AWS Direct Connect desde Amazon EMR](emr-plan-input-directconnect.md)
+ [Cargue grandes cantidades de datos para Amazon EMR con AWS Snowball Edge](emr-plan-input-snowball.md)