Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Parámetros de los algoritmos Built-in
En la siguiente tabla se enumeran los parámetros de cada uno de los algoritmos proporcionados por Amazon SageMaker AI.
| Nombre de algoritmo | Nombre de canal | Modo de entrada de capacitación | Tipo de archivo | Clase de instancia | Paralelizable |
|---|---|---|---|---|---|
| AutoGluon-Tabular | entrenamiento y validación (opcional) | Archivos | CSV | CPU o GPU (solo instancia única) | No |
| BlazingText | capacitación | Archivo o canalización | Archivo de texto (una frase por línea con tokens separados por espacios) | CPU o GPU (solo instancia única) | No |
| CatBoost | entrenamiento y validación (opcional) | Archivos | CSV | CPU (solo instancia única) | No |
| Previsión DeepAR | capacitación y prueba (opcional) | Archivos | Líneas de JSON o Parquet | CPU o GPU | Sí |
| Máquinas de factorización | capacitación y prueba (opcional) | Archivo o canalización | registro IO-protobuf | CPU (GPU para datos densos) | Sí |
| Image Classification - MXNet | capacitación y validación, (opcional) train_lst, validation_lst y modelo | Archivo o canalización | recordIO o archivos de imagen (.jpg o .png) | GPU | Sí |
| Clasificación de imágenes - TensorFlow | entrenamiento y validación | Archivos | archivos de imagen (.jpg, .jpeg o.png) | CPU o GPU | Sí (solo en múltiples GPU en una sola instancia) |
| Información de IP | capacitación y validación (opcional) | Archivos | CSV | CPU o GPU | Sí |
| K-Means | capacitación y prueba (opcional) | Archivo o canalización | registro IO-protobuf o CSV | CPU o GPUCommon (dispositivo de GPU único en una o varias instancias) | No |
| K-Nearest-Neighbors (k-NN) | capacitación y prueba (opcional) | Archivo o canalización | registro IO-protobuf o CSV | CPU o GPU (dispositivo de GPU único en una o varias instancias) | Sí |
| LDA | capacitación y prueba (opcional) | Archivo o canalización | registro IO-protobuf o CSV | CPU (solo instancia única) | No |
| LightGBM | train/training y (opcionalmente) validación | Archivos | CSV | CPU | Sí |
| Aprendiz lineal | capacitación y validación (opcional), prueba o ambos | Archivo o canalización | registro IO-protobuf o CSV | CPU o GPU | Sí |
| Modelo de temas neuronal | capacitación y validación (opcional), prueba o ambos | Archivo o canalización | registro IO-protobuf o CSV | CPU o GPU | Sí |
| Object2Vec | capacitación y validación (opcional), prueba o ambos | Archivos | Líneas de JSON | CPU o GPU (solo instancia única) | No |
| Detección de objetos - MXNet | capacitación y validación, (opcional) train_annotation, validation_annotation y modelo | Archivo o canalización | recordIO o archivos de imagen (.jpg o .png) | GPU | Sí |
| Detección de objetos - TensorFlow | entrenamiento y validación | Archivos | archivos de imagen (.jpg, .jpeg o.png) | GPU | Sí (solo en múltiples GPU en una sola instancia) |
| PCA | capacitación y prueba (opcional) | Archivo o canalización | registro IO-protobuf o CSV | CPU o GPU | Sí |
| Bosque de corte aleatorio | capacitación y prueba (opcional) | Archivo o canalización | registro IO-protobuf o CSV | CPU | Sí |
| Segmentación semántica | capacitación y validación, train_annotation, validation_annotation y (opcional) label_map y modelo | Archivo o canalización | Archivos de imagen | GPU (solo instancia única) | No |
| Modelo Seq2Seq | capacitación, validación y vocabulario | Archivos | registro IO-protobuf | GPU (solo instancia única) | No |
| TabTransformer | entrenamiento y validación (opcional) | Archivos | CSV | CPU o GPU (solo instancia única) | No |
| Clasificación de texto - TensorFlow | entrenamiento y validación | Archivos | CSV | CPU o GPU | Sí (solo en múltiples GPU en una sola instancia) |
| XGBoost (0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21) | capacitación y validación (opcional) | Archivo o canalización | CSV, LibSVM o Parquet | CPU (o GPU para 1.2-1) | Sí |
Los algoritmos que son paralelizables se pueden implementar en varias instancias de cómputo para capacitación distribuida.
En los siguientes temas se proporciona información sobre los formatos de datos, los tipos de instancias de Amazon EC2 recomendados y los CloudWatch registros comunes a todos los algoritmos integrados que proporciona Amazon SageMaker AI.
nota
Para buscar los URI de las imágenes de Docker de los algoritmos integrados gestionados por SageMaker AI, consulte las rutas de registro y el código de ejemplo de Docker.