

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Real-time inferencia
<a name="realtime-endpoints"></a>

 Real-time la inferencia es ideal para cargas de trabajo de inferencia en las que se requieren requisitos de baja latencia, interactivos y en tiempo real. Puede implementar su modelo en los servicios de alojamiento de SageMaker IA y obtener un punto final que pueda usarse para realizar inferencias. Estos puntos de conexión están totalmente gestionados y admiten autoescalado (consulte [Escalado automático de los modelos de Amazon SageMaker AI](endpoint-auto-scaling.md)). Puede monitorear instancias y contenedores individuales en sus puntos finales con métricas mejoradas (consulte[Métricas mejoradas de Amazon SageMaker AI para puntos finales de inferencia](monitoring-cloudwatch-enhanced-metrics.md)).

**Topics**
+ [Implementación de modelos para inferencia en tiempo real](realtime-endpoints-deploy-models.md)
+ [Invocación de modelos para realizar inferencias en tiempo real](realtime-endpoints-test-endpoints.md)
+ [Invoque puntos finales con API OpenAI-compatible](realtime-endpoints-openai-compatible.md)
+ [Puntos de conexión](realtime-endpoints-manage.md)
+ [Opciones de alojamiento](realtime-endpoints-options.md)
+ [Escalado automático de los modelos de Amazon SageMaker AI](endpoint-auto-scaling.md)
+ [Volúmenes de almacén de instancias](host-instance-storage.md)
+ [Validación de modelos en producción](model-validation.md)
+ [Explicabilidad en línea con Clarify SageMaker](clarify-online-explainability.md)
+ [Implemente en varios tipos de instancias con grupos de instancias](realtime-endpoints-heterogeneous.md)
+ [Fine-tune modelos con componentes de inferencia de adaptadores](realtime-endpoints-adapt.md)