Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris. # Fitur yang didukung Amazon SageMaker AI menawarkan empat opsi berikut untuk menerapkan model untuk inferensi. + Real-time inferensi untuk beban kerja inferensi dengan persyaratan real-time, interaktif, latensi rendah. + Transformasi Batch untuk inferensi offline dengan kumpulan data besar. + Inferensi asinkron untuk inferensi mendekati waktu nyata dengan input besar yang membutuhkan waktu pra-pemrosesan yang lebih lama. + Inferensi tanpa server untuk beban kerja inferensi yang memiliki periode idle antara lonjakan lalu lintas. Tabel berikut merangkum fitur platform inti yang didukung oleh setiap opsi inferensi. Itu tidak menampilkan fitur yang dapat disediakan oleh kerangka kerja, wadah Docker khusus, atau melalui rantai layanan yang berbeda. AWS | Fitur | [Real-time inferensi](realtime-endpoints.md) | [Transformasi Batch](batch-transform.md) | [Inferensi asinkron](async-inference.md) | [Inferensi tanpa server](serverless-endpoints.md) | [Kontainer Docker](docker-containers.md) | | --- | --- | --- | --- | --- | --- | | [Dukungan penskalaan otomatis](endpoint-auto-scaling.md) | ✓ | N/A | ✓ | ✓ | N/A | | Dukungan GPU | ✓ 1 | ✓ 1 | ✓ 1 | | [1P](common-info-all-im-models.md), pra-dibangun, BYOC | | Model tunggal | ✓ | ✓ | ✓ | ✓ | N/A | | [Multi-model titik akhir](multi-model-endpoints.md) | ✓ | | | | K-NN, XGBoost, Pembelajar Linear, RCF, Apache MxNet,, scikit-belajar TensorFlow 2 PyTorch | | [Multi-container titik akhir](multi-container-endpoints.md) | ✓ | | | | 1P, pra-dibangun, Perpanjang pra-dibangun, BYOC | | [Pipa inferensi serial](inference-pipelines.md) | ✓ | ✓ | | | 1P, pra-dibangun, Perpanjang pra-dibangun, BYOC | | [Rekomendasi Inferensi](inference-recommender.md) | ✓ | | | | 1P, pra-dibangun, Perpanjang pra-dibangun, BYOC | | Dukungan tautan pribadi | ✓ | ✓ | ✓ | | N/A | | [Dukungan capture/Model monitor data](model-monitor.md) | ✓ | ✓ | | | N/A | | [DLC didukung](https://github.com/aws/deep-learning-containers/blob/master/available_images.md) | 1P, pra-dibangun, Perpanjang pra-dibangun, BYOC | [1P](common-info-all-im-models.md), pra-dibangun, Perpanjang pra-dibangun, BYOC | 1P, pra-dibangun, Perpanjang pra-dibangun, BYOC | 1P, pra-dibangun, Perpanjang pra-dibangun, BYOC | N/A | | Protokol didukung | HTTP (S) | HTTP (S) | HTTP (S) | HTTP (S) | N/A | | Ukuran muatan | < 6 MB | ≤ 100 MB | ≤ 1 GB | ≤ 4 MB | | | Pengkodean chunked HTTP | Framework dependen, 1P tidak didukung | N/A | Framework dependen, 1P tidak didukung | Framework dependen, 1P tidak didukung | N/A | | Batas waktu permintaan | < 60 detik | Hari | < 1 jam | < 60 detik | N/A | | [Pagar pembatas penyebaran: penerapan blue/green ](deployment-guardrails.md) | ✓ | N/A | ✓ | | N/A | | [Pagar pembatas penyebaran: penerapan bergulir](deployment-guardrails.md) | ✓ | N/A | ✓ | | N/A | | [Pengujian bayangan](shadow-tests.md) | ✓ | | | | N/A | | Skala ke nol | | N/A | ✓ | ✓ | N/A | | Dukungan paket model pasar | ✓ | ✓ | ✓ | | N/A | | Dukungan cloud pribadi virtual | ✓ | ✓ | ✓ | | N/A | | Beberapa varian produksi mendukung | ✓ | | | | N/A | | Isolasi jaringan | ✓ | | ✓ | | N/A | | [Dukungan penyajian paralel model](model-parallel-intro.md) | ✓ 3 | ✓ | ✓ 3 | | ✓ 3 | | Enkripsi volume | ✓ | ✓ | ✓ | ✓ | N/A | | Pelanggan AWS KMS | ✓ | ✓ | ✓ | ✓ | N/A | | d contoh dukungan | ✓ | ✓ | ✓ | | N/A | | [dukungan inf1](neo-supported-cloud.md) | ✓ | | | | ✓ | Dengan SageMaker AI, Anda dapat menerapkan satu model, atau beberapa model di belakang titik akhir inferensi tunggal untuk inferensi waktu nyata. Tabel berikut merangkum fitur-fitur inti yang didukung oleh berbagai opsi hosting yang datang dengan inferensi real-time. | Fitur | [Titik akhir model tunggal](realtime-single-model.md) | [Multi-model titik akhir](multi-model-endpoints.md) | [Pipa inferensi serial](inference-pipelines.md) | [Multi-container titik akhir](multi-container-endpoints.md) | | --- | --- | --- | --- | --- | | [Dukungan penskalaan otomatis](endpoint-auto-scaling.md) | ✓ | ✓ | ✓ | ✓ | | Dukungan GPU | ✓ 1 | ✓ | ✓ | | | Model tunggal | ✓ | ✓ | ✓ | ✓ | | [Multi-model titik akhir](multi-model-endpoints.md) | | ✓ | ✓ | N/A | | [Multi-container titik akhir](multi-container-endpoints.md) | ✓ | | | N/A | | [Pipa inferensi serial](inference-pipelines.md) | ✓ | ✓ | N/A | | | [Rekomendasi Inferensi](inference-recommender.md) | ✓ | | | | | Dukungan tautan pribadi | ✓ | ✓ | ✓ | ✓ | | [Dukungan capture/Model monitor data](model-monitor.md) | ✓ | N/A | N/A | N/A | | DLC didukung | 1P, pra-dibangun, Perpanjang pra-dibangun, BYOC | K-NN, XGBoost, Pembelajar Linear, RCF, Apache MxNet,, scikit-belajar TensorFlow 2 PyTorch | 1P, pra-dibangun, Perpanjang pra-dibangun, BYOC | 1P, pra-dibangun, Perpanjang pra-dibangun, BYOC | | Protokol didukung | HTTP (S) | HTTP (S) | HTTP (S) | HTTP (S) | | Ukuran muatan | < 6 MB | < 6 MB | < 6 MB | < 6 MB | | Batas waktu permintaan | < 60 detik | < 60 detik | < 60 detik | < 60 detik | | [Pagar pembatas penyebaran: penerapan blue/green ](deployment-guardrails.md) | ✓ | ✓ | ✓ | ✓ | | [Pagar pembatas penyebaran: penerapan bergulir](deployment-guardrails.md) | ✓ | ✓ | ✓ | ✓ | | [Pengujian bayangan](shadow-tests.md) | ✓ | | | | | Dukungan paket model pasar | ✓ | | | | | Dukungan cloud pribadi virtual | ✓ | ✓ | ✓ | ✓ | | Beberapa varian produksi mendukung | ✓ | | ✓ | ✓ | | Isolasi jaringan | ✓ | ✓ | ✓ | ✓ | | [Dukungan penyajian paralel model](model-parallel-intro.md) | ✓ 3 | | ✓ 3 | | | Enkripsi volume | ✓ | ✓ | ✓ | ✓ | | Pelanggan AWS KMS | ✓ | ✓ | ✓ | ✓ | | d contoh dukungan | ✓ | ✓ | ✓ | ✓ | | [dukungan inf1](neo-supported-cloud.md) | ✓ | | | | 1 Ketersediaan jenis instans Amazon EC2 tergantung pada Wilayah. AWS Untuk ketersediaan instans khusus untuk AWS, lihat [Harga Amazon SageMaker AI](https://aws.amazon.com/sagemaker/pricing/). 2 Untuk menggunakan kerangka kerja atau algoritme lain, gunakan toolkit Inference SageMaker AI untuk membangun wadah yang mendukung titik akhir multi-model. 3 Dengan SageMaker AI, Anda dapat menerapkan model besar (hingga 500 GB) untuk inferensi. Anda dapat mengonfigurasi pemeriksaan kesehatan kontainer dan mengunduh kuota batas waktu, hingga 60 menit. Ini akan memungkinkan Anda memiliki lebih banyak waktu untuk mengunduh dan memuat model dan sumber daya terkait Anda. Untuk informasi selengkapnya, lihat [SageMaker Parameter titik akhir AI untuk inferensi model besar](large-model-inference-hosting.md). Anda dapat menggunakan [wadah Inferensi model besar](https://github.com/aws/deep-learning-containers/blob/master/available_images.md#large-model-inference-containers) yang kompatibel dengan SageMaker AI. Anda juga dapat menggunakan pustaka paralelisasi model pihak ketiga, seperti Triton dengan dan. FasterTransformer DeepSpeed Anda harus memastikan bahwa mereka kompatibel dengan SageMaker AI.