View a markdown version of this page

Implementación de un modelo - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Implementación de un modelo

Para implementar un SageMaker Neo-compiled modelo de Amazon en un punto de conexión HTTPS, debe configurar y crear el punto de enlace para el modelo mediante los servicios de alojamiento de Amazon SageMaker AI. Actualmente, los desarrolladores pueden usar SageMaker las API de Amazon para implementar módulos en instancias ml.c5, ml.c4, ml.m5, ml.m4, ml.p3, ml.p2 y ml.inf1.

Para las instancias Inferentia y Trainium, los modelos deben compilarse específicamente para dichas instancias. No se garantiza que los modelos compilados para otros tipos de instancia funcionen con instancias Inferentia o Trainium.

Cuando se implementa un modelo compilado, es preciso usar la misma instancia para el destino que utilizó para la compilación. Esto crea un punto final de IA que SageMaker puede usar para realizar inferencias. Puede implementar un Neo-compiled modelo mediante cualquiera de las siguientes opciones: Amazon SageMaker AI SDK for Python, SDK for Python (Boto3) y la consola AI. AWS Command Line InterfaceSageMaker

nota

Para implementar un modelo mediante AWS CLI la consola o Boto3, consulte Neo Inference Container Images para seleccionar el URI de la imagen de inferencia para su contenedor principal.