

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Real-time inferensi
<a name="realtime-endpoints"></a>

 Real-time inferensi sangat ideal untuk beban kerja inferensi di mana Anda memiliki persyaratan real-time, interaktif, latensi rendah. Anda dapat menerapkan model Anda ke layanan hosting SageMaker AI dan mendapatkan titik akhir yang dapat digunakan untuk inferensi. Titik akhir ini dikelola sepenuhnya dan mendukung penskalaan otomatis (lihat). [Penskalaan otomatis model Amazon SageMaker AI](endpoint-auto-scaling.md) Anda dapat memantau instance dan kontainer individual di titik akhir Anda dengan metrik yang disempurnakan (lihat). [Amazon SageMaker AI meningkatkan metrik untuk titik akhir inferensi](monitoring-cloudwatch-enhanced-metrics.md)

**Topics**
+ [Terapkan model untuk inferensi waktu nyata](realtime-endpoints-deploy-models.md)
+ [Memanggil model untuk inferensi waktu nyata](realtime-endpoints-test-endpoints.md)
+ [Memanggil titik akhir dengan API OpenAI-compatible](realtime-endpoints-openai-compatible.md)
+ [Titik akhir](realtime-endpoints-manage.md)
+ [Opsi hosting](realtime-endpoints-options.md)
+ [Penskalaan otomatis model Amazon SageMaker AI](endpoint-auto-scaling.md)
+ [Volume penyimpanan instans](host-instance-storage.md)
+ [Validasi model dalam produksi](model-validation.md)
+ [Penjelasan online dengan Clarify SageMaker](clarify-online-explainability.md)
+ [Terapkan ke beberapa tipe instans dengan kumpulan instance](realtime-endpoints-heterogeneous.md)
+ [Fine-tune model dengan komponen inferensi adaptor](realtime-endpoints-adapt.md)