Planificación de transferencias hacia o desde sistemas de almacenamiento en la nube de terceros - AWS DataSync

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Planificación de transferencias hacia o desde sistemas de almacenamiento en la nube de terceros

Al planificar transferencias de datos entre nubes, tenga en cuenta lo siguiente:

  • Uso de un agente: un agente solo es necesario para acceder al almacenamiento en otras nubes cuando se utilizan tareas en modo básico. Las tareas en modo mejorado no requieren un agente. Si decide utilizar un agente, puede implementarlo como una instancia de Amazon EC2 al transferir desde el almacenamiento de objetos compatible con S3 de un proveedor de servicios en la nube, o como una máquina virtual de Google Compute Engine o de Azure para transferencias desde esos servicios de almacenamiento específicos, respectivamente. Al transferir desde sistemas de archivos en Google y Azure, se recomienda implementar el agente como una máquina virtual de Google o de Azure para que el agente se encuentre lo más cerca posible del sistema de archivos. Además, DataSync comprime los datos desde el agente hasta ellos AWS, lo que puede ayudar a reducir los costes de salida. DataSync proporciona una lista de ubicaciones en la nube validadas que proporcionan la compatibilidad requerida con la API de Amazon S3.

  • Punto de conexión de almacenamiento de objetos de la otra nube: el punto de conexión de almacenamiento de un proveedor de nube externo suele ser específico de la región o de la cuenta. El punto final regional se utiliza como servidor en la ubicación de almacenamiento de DataSync objetos, junto con un nombre de bucket específico.

  • Clases de almacenamiento de los objetos de origen: al igual que Amazon S3, algunos proveedores de servicios en la nube admiten un nivel de archivo que requiere una restauración antes de poder acceder a los objetos archivados. Por ejemplo, los objetos en el nivel de archivo de Azure Blob se deben obtener para permitir el acceso estándar antes de una transferencia de datos. Se puede acceder a los objetos en el nivel de archivo de Google Cloud Storage de inmediato y sin restauración, pero el acceso directo al nivel de archivo conlleva costos de obtención asociados. Revise la documentación sobre las clases de almacenamiento entre nubes para determinar los requisitos de acceso y las tarifas de recuperación antes de iniciar la transferencia de datos. Para obtener más información sobre la restauración de objetos archivados en Amazon S3, consulte Restauración de un objeto archivado en la Guía del usuario de Amazon Simple Storage Service.

  • Acceso al almacenamiento de objetos: transferir datos entre proveedores de servicios en la nube de terceros requiere acceso al almacenamiento de objetos de la otra nube mediante claves de autenticación. Por ejemplo, para proporcionar acceso a Google Cloud Storage, debes configurar una ubicación de almacenamiento de DataSync objetos que se conecte a la API XML de Google Cloud Storage y se autentique mediante una clave de código de autenticación de mensajes (HMAC) basada en hash para tu cuenta de servicio. Para el almacenamiento de blobs de Azure, configuras una DataSync ubicación de blobs de Azure dedicada que se autentica mediante tokens SAS. DataSync se utiliza AWS Secrets Manager para almacenar de forma segura las credenciales de almacenamiento de objetos. Para obtener más información, consulte Protección de las credenciales de las ubicaciones de almacenamiento.

  • Compatibilidad con etiquetas de objetos:

    • A diferencia de Amazon S3, no todos los proveedores de nube admiten etiquetas de objetos. DataSync las tareas pueden fallar al intentar leer las etiquetas de la ubicación de origen si el proveedor de la nube no admite etiquetas de objetos a través de la API de Amazon S3 o si las credenciales que proporciona no son suficientes para recuperar las etiquetas. DataSyncofrece una opción de tarea para desactivar la lectura y la copia de etiquetas de objetos durante una transferencia si no se admiten las etiquetas de objetos o si no se desea conservarlas. Revise la documentación del proveedor de servicios en la nube para determinar si se admiten las etiquetas de objetos y verifique la configuración de etiquetas de objetos de la tarea de transferencia antes de iniciarla.

    • Puede utilizar la API de Amazon S3 para comprobar si un proveedor de servicios en la nube devuelve una solicitud get-object-tagging. Para obtener más información, consulte get-object-tagging en la Referencia de comandos de la AWS CLI .

      Un proveedor de servicios en la nube que admite etiquetas de objetos devuelve una respuesta similar al siguiente ejemplo:

      aws s3api get-object-tagging --bucket BUCKET_NAME --endpoint- url=https://BUCKET_ENDPOINT --key prefix/file1 { "TagSet": [] }

      Un proveedor de servicios en la nube que no admite get-object-tagging devuelve el siguiente mensaje:

      aws s3api get-object-tagging --bucket BUCKET_NAME --endpoint- url=https://BUCKET_ENDPOINT --key prefix/file1 An error occurred (OperationNotSupported) when calling the GetObjectTagging operation: The operation is not supported for this resource
  • Costos asociados a las solicitudes y a la salida de datos: transferir datos desde el almacenamiento de objetos en la nube conlleva costos de solicitudes y de salida de datos asociados con la lectura de datos y la transferencia de datos salientes. Los cargos por solicitudes varían entre proveedores de servicios en la nube y, cuando corresponde, entre clases de almacenamiento. Consulte la documentación del proveedor de servicios en la nube sobre los costos específicos de las solicitudes relativos a la clase de almacenamiento desde la que planea leer. Para obtener una descripción general de los cargos por solicitud que se DataSync cobran por las transferencias de datos, consulte Cómo evaluar los costos de las solicitudes de S3 al DataSync utilizarlas y sus AWS DataSync precios. Transferir datos fuera de proveedores de servicios en la nube específicos genera cargos por salida de datos. Los costos de transferencia de datos varían entre proveedores de servicios en la nube y también dependen de la región en la que se almacenan los datos.

  • Tasas de solicitudes de almacenamiento de objetos: los proveedores de servicios en la nube presentan distintas características de rendimiento y de tasas de solicitudes en las plataformas de almacenamiento de objetos. Revise las tasas de solicitudes del otro proveedor de servicios en la nube y determine dónde se aplican los límites de solicitudes. Planifique con antelación las transferencias altamente paralelizadas que constan de varios agentes, cuando se requiera una partición específica o incrementos de rendimiento.

    Amazon S3 dispone de tasas de solicitudes documentadas que puede utilizar como base para diseñar su solución. Las tasas de solicitudes de Amazon S3 se aplican por prefijo particionado y se pueden escalar en múltiples prefijos. Para obtener más información, consulte Prácticas recomendadas y patrones de diseño: optimización del rendimiento de Amazon S3 en la Guía del usuario de Amazon Simple Storage Service.