Implementación de un modelo

Para implementar un SageMaker Neo-compiled modelo de Amazon en un punto de conexión HTTPS, debe configurar y crear el punto de enlace para el modelo mediante los servicios de alojamiento de Amazon SageMaker AI. Actualmente, los desarrolladores pueden usar SageMaker las API de Amazon para implementar módulos en instancias ml.c5, ml.c4, ml.m5, ml.m4, ml.p3, ml.p2 y ml.inf1.

Para las instancias Inferentia y Trainium, los modelos deben compilarse específicamente para dichas instancias. No se garantiza que los modelos compilados para otros tipos de instancia funcionen con instancias Inferentia o Trainium.

Cuando se implementa un modelo compilado, es preciso usar la misma instancia para el destino que utilizó para la compilación. Esto crea un punto final de IA que SageMaker puede usar para realizar inferencias. Puede implementar un Neo-compiled modelo mediante cualquiera de las siguientes opciones: Amazon SageMaker AI SDK for Python, SDK for Python (Boto3) y la consola AI. AWS Command Line InterfaceSageMaker

nota

Para implementar un modelo mediante AWS CLI la consola o Boto3, consulte Neo Inference Container Images para seleccionar el URI de la imagen de inferencia para su contenedor principal.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Tipos de instancias y marcos compatibles

Requisitos previos