Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Real-time inférence
Real-time l'inférence est idéale pour les charges de travail d'inférence nécessitant une faible latence, une interaction en temps réel. Vous pouvez déployer votre modèle sur des services d'hébergement d' SageMaker IA et obtenir un point de terminaison pouvant être utilisé à des fins d'inférence. Ces points de terminaison sont entièrement gérés et prennent en charge la scalabilité automatique (voir Mise à l'échelle automatique des modèles Amazon SageMaker AI). Vous pouvez surveiller des instances et des conteneurs individuels sur vos points de terminaison à l'aide de métriques améliorées (voirMesures améliorées d'Amazon SageMaker AI pour les points de terminaison d'inférence).