

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Administración de las rutas de almacenamiento para diferentes tipos de almacenamiento local de instancias
<a name="model-train-storage-tips-considerations"></a>

Tenga en cuenta lo siguiente al configurar las rutas de almacenamiento para los trabajos de formación en SageMaker IA.
+ Si desea almacenar artefactos para entrenamiento distribuido en el directorio `/opt/ml/output/data`, debe asociar correctamente los subdirectorios o usar nombres de archivo únicos para los artefactos en la definición del modelo o en el script de entrenamiento. Si los subdirectorios y los nombres de los archivos no están configurados correctamente, es posible que todos los trabajadores de entrenamiento distribuida escriban los resultados con el mismo nombre de archivo y en la misma ruta de salida en Amazon S3.
+ Si utilizas un contenedor de formación personalizado, asegúrate de instalar el [kit de herramientas de SageMaker formación](https://github.com/aws/sagemaker-training-toolkit) que te ayudará a configurar el entorno para los trabajos de SageMaker formación. De lo contrario, debe especificar las variables de entorno de forma explícita en su Dockerfile. Para obtener más información, consulte [Crear un contenedor con sus propios algoritmos y modelos](https://docs.aws.amazon.com/sagemaker/latest/dg/docker-containers-create.html).
+ Cuando se utiliza una instancia de ML con [volúmenes SSD NVMe](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ssd-instance-store.html#nvme-ssd-volumes), la SageMaker IA no aprovisiona el almacenamiento gp2 de Amazon EBS. El almacenamiento disponible se fija a la capacidad de almacenamiento de la NVMe-type instancia. SageMaker La IA configura las rutas de almacenamiento para entrenar conjuntos de datos, puntos de control, artefactos de modelos y salidas a fin de utilizar toda la capacidad del almacenamiento de la instancia. Por ejemplo, las familias de instancias de aprendizaje automático con el almacenamiento de NVMe-type instancias incluyen`ml.p4d`, y`ml.g4dn`. `ml.g5` Si utiliza una instancia de aprendizaje automático con la opción de EBS-only almacenamiento y sin almacenamiento de instancias, debe definir el tamaño del volumen de EBS mediante el `volume_size` parámetro de la clase de estimador de SageMaker IA (o `VolumeSizeInGB` si utiliza la `ResourceConfig` API). Por ejemplo, las familias de instancias de ML que utilizan volúmenes de EBS incluyen `ml.c5` y `ml.p2`. Para buscar tipos de instancias y sus volúmenes y tipos de almacenamiento de instancias, consulte [Tipos de instancias de Amazon EC2](https://aws.amazon.com/ec2/instance-types/).
+ Las rutas predeterminadas para los trabajos de SageMaker formación se montan en los volúmenes de Amazon EBS o en los volúmenes SSD NVMe de la instancia de ML. Cuando adaptes tu guion de entrenamiento a la SageMaker IA, asegúrate de utilizar las rutas predeterminadas que se indican en el tema anterior. [SageMaker Las variables de entorno de la IA y las rutas predeterminadas para el entrenamiento: ubicaciones de almacenamiento](model-train-storage-env-var-summary.md) Le recomendamos que utilice el `/tmp` directorio como espacio para almacenar temporalmente cualquier objeto grande durante el entrenamiento. Esto significa que no debe utilizar directorios que estén montados en un espacio de disco pequeño asignado al sistema, como `/user` y `/home`, para evitar errores de falta de espacio.

Para obtener más información, consulta el blog sobre aprendizaje AWS automático [Elige la mejor fuente de datos para tu trabajo de SageMaker formación en Amazon](https://aws.amazon.com/blogs/machine-learning/choose-the-best-data-source-for-your-amazon-sagemaker-training-job/), donde se analizan más a fondo casos prácticos y puntos de referencia de rendimiento de fuentes de datos y modos de entrada.