Parámetros de los algoritmos Built-in

En la siguiente tabla se enumeran los parámetros de cada uno de los algoritmos proporcionados por Amazon SageMaker AI.

Nombre de algoritmo	Nombre de canal	Modo de entrada de capacitación	Tipo de archivo	Clase de instancia	Paralelizable
AutoGluon-Tabular	entrenamiento y validación (opcional)	Archivos	CSV	CPU o GPU (solo instancia única)	No
BlazingText	capacitación	Archivo o canalización	Archivo de texto (una frase por línea con tokens separados por espacios)	CPU o GPU (solo instancia única)	No
CatBoost	entrenamiento y validación (opcional)	Archivos	CSV	CPU (solo instancia única)	No
Previsión DeepAR	capacitación y prueba (opcional)	Archivos	Líneas de JSON o Parquet	CPU o GPU	Sí
Máquinas de factorización	capacitación y prueba (opcional)	Archivo o canalización	registro IO-protobuf	CPU (GPU para datos densos)	Sí
Image Classification - MXNet	capacitación y validación, (opcional) train_lst, validation_lst y modelo	Archivo o canalización	recordIO o archivos de imagen (.jpg o .png)	GPU	Sí
Clasificación de imágenes - TensorFlow	entrenamiento y validación	Archivos	archivos de imagen (.jpg, .jpeg o.png)	CPU o GPU	Sí (solo en múltiples GPU en una sola instancia)
Información de IP	capacitación y validación (opcional)	Archivos	CSV	CPU o GPU	Sí
K-Means	capacitación y prueba (opcional)	Archivo o canalización	registro IO-protobuf o CSV	CPU o GPUCommon (dispositivo de GPU único en una o varias instancias)	No
K-Nearest-Neighbors (k-NN)	capacitación y prueba (opcional)	Archivo o canalización	registro IO-protobuf o CSV	CPU o GPU (dispositivo de GPU único en una o varias instancias)	Sí
LDA	capacitación y prueba (opcional)	Archivo o canalización	registro IO-protobuf o CSV	CPU (solo instancia única)	No
LightGBM	train/training y (opcionalmente) validación	Archivos	CSV	CPU	Sí
Aprendiz lineal	capacitación y validación (opcional), prueba o ambos	Archivo o canalización	registro IO-protobuf o CSV	CPU o GPU	Sí
Modelo de temas neuronal	capacitación y validación (opcional), prueba o ambos	Archivo o canalización	registro IO-protobuf o CSV	CPU o GPU	Sí
Object2Vec	capacitación y validación (opcional), prueba o ambos	Archivos	Líneas de JSON	CPU o GPU (solo instancia única)	No
Detección de objetos - MXNet	capacitación y validación, (opcional) train_annotation, validation_annotation y modelo	Archivo o canalización	recordIO o archivos de imagen (.jpg o .png)	GPU	Sí
Detección de objetos - TensorFlow	entrenamiento y validación	Archivos	archivos de imagen (.jpg, .jpeg o.png)	GPU	Sí (solo en múltiples GPU en una sola instancia)
PCA	capacitación y prueba (opcional)	Archivo o canalización	registro IO-protobuf o CSV	CPU o GPU	Sí
Bosque de corte aleatorio	capacitación y prueba (opcional)	Archivo o canalización	registro IO-protobuf o CSV	CPU	Sí
Segmentación semántica	capacitación y validación, train_annotation, validation_annotation y (opcional) label_map y modelo	Archivo o canalización	Archivos de imagen	GPU (solo instancia única)	No
Modelo Seq2Seq	capacitación, validación y vocabulario	Archivos	registro IO-protobuf	GPU (solo instancia única)	No
TabTransformer	entrenamiento y validación (opcional)	Archivos	CSV	CPU o GPU (solo instancia única)	No
Clasificación de texto - TensorFlow	entrenamiento y validación	Archivos	CSV	CPU o GPU	Sí (solo en múltiples GPU en una sola instancia)
XGBoost (0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21)	capacitación y validación (opcional)	Archivo o canalización	CSV, LibSVM o Parquet	CPU (o GPU para 1.2-1)	Sí

Los algoritmos que son paralelizables se pueden implementar en varias instancias de cómputo para capacitación distribuida.

En los siguientes temas se proporciona información sobre los formatos de datos, los tipos de instancias de Amazon EC2 recomendados y los CloudWatch registros comunes a todos los algoritmos integrados que proporciona Amazon SageMaker AI.

nota

Para buscar los URI de las imágenes de Docker de los algoritmos integrados gestionados por SageMaker AI, consulte las rutas de registro y el código de ejemplo de Docker.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Built-in algoritmos y modelos previamente entrenados

Formatos de datos comunes para la capacitación