View a markdown version of this page

Real-time inferensi - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Real-time inferensi

Real-time inferensi sangat ideal untuk beban kerja inferensi di mana Anda memiliki persyaratan real-time, interaktif, latensi rendah. Anda dapat menerapkan model Anda ke layanan hosting SageMaker AI dan mendapatkan titik akhir yang dapat digunakan untuk inferensi. Titik akhir ini dikelola sepenuhnya dan mendukung penskalaan otomatis (lihat). Penskalaan otomatis model Amazon SageMaker AI Anda dapat memantau instance dan kontainer individual di titik akhir Anda dengan metrik yang disempurnakan (lihat). Amazon SageMaker AI meningkatkan metrik untuk titik akhir inferensi