Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Real-time inferencia
Real-time la inferencia es ideal para cargas de trabajo de inferencia en las que se requieren requisitos de baja latencia, interactivos y en tiempo real. Puede implementar su modelo en los servicios de alojamiento de SageMaker IA y obtener un punto final que pueda usarse para realizar inferencias. Estos puntos de conexión están totalmente gestionados y admiten autoescalado (consulte Escalado automático de los modelos de Amazon SageMaker AI). Puede monitorear instancias y contenedores individuales en sus puntos finales con métricas mejoradas (consulteMétricas mejoradas de Amazon SageMaker AI para puntos finales de inferencia).