

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Gerenciamento de caminhos de armazenamento para tipos diferentes de armazenamento local de instância
<a name="model-train-storage-tips-considerations"></a>

Considere o seguinte ao configurar caminhos de armazenamento para trabalhos de treinamento em SageMaker IA.
+ Se quiser armazenar artefatos de treinamento para treinamento distribuído no diretório `/opt/ml/output/data`, você deve anexar subdiretórios adequadamente ou usar nomes de arquivo exclusivos para os artefatos por meio da definição do modelo ou do script de treinamento. Se os subdiretórios e nomes de arquivos não estiverem configurados corretamente, todos os operadores do treinamento distribuído poderão gravar as saídas no mesmo nome de arquivo no mesmo caminho de saída no Amazon S3.
+ Se você usa um contêiner de treinamento personalizado, certifique-se de instalar o [kit de ferramentas de SageMaker treinamento](https://github.com/aws/sagemaker-training-toolkit) que ajuda a configurar o ambiente para trabalhos de SageMaker treinamento. Caso contrário, você deve especificar as variáveis de ambiente explicitamente em seu Dockerfile. Para obter mais informações, consulte [Criar um contêiner com seus próprios algoritmos e modelos](https://docs.aws.amazon.com/sagemaker/latest/dg/docker-containers-create.html).
+ Ao usar uma instância de ML com [volumes SSD NVMe](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ssd-instance-store.html#nvme-ssd-volumes), a SageMaker IA não provisiona o armazenamento gp2 do Amazon EBS. O armazenamento disponível é fixo na capacidade de armazenamento da NVMe-type instância. SageMaker A IA configura caminhos de armazenamento para treinar conjuntos de dados, pontos de verificação, artefatos de modelo e saídas para usar toda a capacidade do armazenamento da instância. Por exemplo, famílias de instâncias de ML com o armazenamento de NVMe-type instâncias incluem `ml.p4d``ml.g4dn`, `ml.g5` e. Ao usar uma instância de ML com a opção EBS-only de armazenamento e sem armazenamento de instância, você deve definir o tamanho do volume do EBS por meio do `volume_size` parâmetro na classe do estimador de SageMaker IA (ou `VolumeSizeInGB` se estiver usando a `ResourceConfig` API). Por exemplo, famílias de instâncias de ML que usam volumes do EBS incluem `ml.c5` e `ml.p2`. Para pesquisar os tipos de instância e seus tipos e volumes de armazenamento de instâncias, consulte [Tipos de instância do Amazon EC2](https://aws.amazon.com/ec2/instance-types/).
+ Os caminhos padrão para trabalhos de SageMaker treinamento são montados nos volumes Amazon EBS ou nos volumes SSD NVMe da instância de ML. Ao adaptar seu script de treinamento à SageMaker IA, certifique-se de usar os caminhos padrão listados no tópico anterior sobre[SageMaker Variáveis de ambiente de IA e os caminhos padrão para locais de armazenamento de treinamento](model-train-storage-env-var-summary.md). Recomendamos que você use o diretório `/tmp` como um espaço rascunho para armazenar temporariamente objetos grandes durante o treinamento. Isso significa que você não deve usar diretórios montados em um pequeno espaço em disco alocado para o sistema, como `/user` e `/home`, para evitar erros de falta de espaço.

Para saber mais, consulte o blog de aprendizado AWS de máquina [Escolha a melhor fonte de dados para seu trabalho de SageMaker treinamento na Amazon](https://aws.amazon.com/blogs/machine-learning/choose-the-best-data-source-for-your-amazon-sagemaker-training-job/), que discute mais detalhadamente estudos de caso e benchmarks de desempenho de fontes de dados e modos de entrada.