

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 即時推論
<a name="realtime-endpoints"></a>

 即時推論非常適合滿足您即時、互動式、低延遲需要的推論工作負載。您可以將模型部署到 SageMaker AI 託管服務，並取得可用於推論的端點。這些端點是完全受管且支援自動調度資源 (請參閱[Amazon SageMaker AI 模型的自動擴展](endpoint-auto-scaling.md))。您可以使用增強型指標監控端點上的個別執行個體和容器 （請參閱 [適用於推論端點的 Amazon SageMaker AI 增強指標](monitoring-cloudwatch-enhanced-metrics.md))。

**Topics**
+ [部署用於即時推論的模型](realtime-endpoints-deploy-models.md)
+ [調用模型以進行即時推論](realtime-endpoints-test-endpoints.md)
+ [使用 OpenAI 相容 APIs叫用端點](realtime-endpoints-openai-compatible.md)
+ [端點](realtime-endpoints-manage.md)
+ [託管選項](realtime-endpoints-options.md)
+ [Amazon SageMaker AI 模型的自動擴展](endpoint-auto-scaling.md)
+ [執行個體存放區磁碟區](host-instance-storage.md)
+ [驗證生產環境中的模型](model-validation.md)
+ [SageMaker Clarify 線上可解釋性](clarify-online-explainability.md)
+ [使用執行個體集區部署至多個執行個體類型](realtime-endpoints-heterogeneous.md)
+ [使用轉接器推論元件微調模型](realtime-endpoints-adapt.md)