本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。 # 支援的功能 Amazon SageMaker AI 提供下列四個選項來部署推論的模型。 + 即時推論，適用於即時、互動式、低延遲需要的推論工作負載。 + 批次轉換，適用於具有大型資料集的離線推論。 + 非同步推論，適用於具有需要較長預先處理時間之大型輸入的接近即時推論。 + 無伺服器推論，適用於流量範圍之間有閒置期間的推論工作負載。下表摘要說明每個推論選項支援的核心平台功能。它不會顯示架構、自訂 Docker 容器或透過串連不同 AWS 服務所提供的功能。 | 功能 | [即時推論](realtime-endpoints.md) | [批次轉換](batch-transform.md) | [非同步推論](async-inference.md) | [無伺服器推論](serverless-endpoints.md) | [Docker 容器](docker-containers.md) | | --- | --- | --- | --- | --- | --- | | [自動調整規模支援](endpoint-auto-scaling.md) | ✓ | N/A | ✓ | ✓ | N/A | | GPU 支援 | ✓1 | ✓1 | ✓1 | | [1P](common-info-all-im-models.md)、預先建置、BYOC | | 單一模型 | ✓ | ✓ | ✓ | ✓ | N/A | | [多模型端點](multi-model-endpoints.md) | ✓ | | | | k-NN、XGBoost、線性學習程式、RCF、TensorFlow、Apache MXNet、PyTorch、scikit-learn 2 | | [多容器端點](multi-container-endpoints.md) | ✓ | | | | 1P、預先建置、延伸預先建置、BYOC | | [序列推論管道](inference-pipelines.md) | ✓ | ✓ | | | 1P、預先建置、延伸預先建置、BYOC | | [推論建議程式](inference-recommender.md) | ✓ | | | | 1P、預先建置、延伸預先建置、BYOC | | 私有連結支援 | ✓ | ✓ | ✓ | | N/A | | [資料擷取/模型監控支援](model-monitor.md) | ✓ | ✓ | | | N/A | | [支援的 DLC](https://github.com/aws/deep-learning-containers/blob/master/available_images.md) | 1P、預先建置、延伸預先建置、BYOC | [1P](common-info-all-im-models.md)、預先建置、延伸預先建置、BYOC | 1P、預先建置、延伸預先建置、BYOC | 1P、預先建置、延伸預先建置、BYOC | N/A | | 支援的通訊協定 | HTTP(S) | HTTP(S) | HTTP(S) | HTTP(S) | N/A | | 承載大小 | < 6 MB | ≤ 100 MB | ≤ 1 GB | ≤ 4 MB | | | HTTP 區塊編碼 | 架構相依、1P 不支援 | N/A | 架構相依、1P 不支援 | 架構相依、1P 不支援 | N/A | | 請求逾時 | < 60 秒 | 天 | < 1 小時 | < 60 秒 | N/A | | [部署防護機制：藍/綠部署](deployment-guardrails.md) | ✓ | N/A | ✓ | | N/A | | [部署防護機制：滾動部署](deployment-guardrails.md) | ✓ | N/A | ✓ | | N/A | | [陰影測試](shadow-tests.md) | ✓ | | | | N/A | | 擴展至零 | | N/A | ✓ | ✓ | N/A | | 市場模型套件支援 | ✓ | ✓ | ✓ | | N/A | | Virtual Private Cloud 支援 | ✓ | ✓ | ✓ | | N/A | | 多種生產變體支援 | ✓ | | | | N/A | | 網路隔離 | ✓ | | ✓ | | N/A | | [模型並行服務支援](model-parallel-intro.md) | ✓3 | ✓ | ✓3 | | ✓3 | | 磁碟區加密 | ✓ | ✓ | ✓ | ✓ | N/A | | 客戶 AWS KMS | ✓ | ✓ | ✓ | ✓ | N/A | | d 執行個體支援 | ✓ | ✓ | ✓ | | N/A | | [inf1 支援](neo-supported-cloud.md) | ✓ | | | | ✓ | 使用 SageMaker AI，您可以在單一推論端點後部署單一模型或多個模型，進行即時推論。下表摘要說明各種託管選項支援的核心功能，包括即時推論。 | 功能 | [單一模型端點](realtime-single-model.md) | [多模型端點](multi-model-endpoints.md) | [序列推論管道](inference-pipelines.md) | [多容器端點](multi-container-endpoints.md) | | --- | --- | --- | --- | --- | | [自動調整規模支援](endpoint-auto-scaling.md) | ✓ | ✓ | ✓ | ✓ | | GPU 支援 | ✓1 | ✓ | ✓ | | | 單一模型 | ✓ | ✓ | ✓ | ✓ | | [多模型端點](multi-model-endpoints.md) | | ✓ | ✓ | N/A | | [多容器端點](multi-container-endpoints.md) | ✓ | | | N/A | | [序列推論管道](inference-pipelines.md) | ✓ | ✓ | N/A | | | [推論建議程式](inference-recommender.md) | ✓ | | | | | 私有連結支援 | ✓ | ✓ | ✓ | ✓ | | [資料擷取/模型監控支援](model-monitor.md) | ✓ | N/A | N/A | N/A | | 支援的 DLC | 1P、預先建置、延伸預先建置、BYOC | k-NN、XGBoost、線性學習程式、RCF、TensorFlow、Apache MXNet、PyTorch、scikit-learn 2 | 1P、預先建置、延伸預先建置、BYOC | 1P、預先建置、延伸預先建置、BYOC | | 支援的通訊協定 | HTTP(S) | HTTP(S) | HTTP(S) | HTTP(S) | | 承載大小 | < 6 MB | < 6 MB | < 6 MB | < 6 MB | | 請求逾時 | < 60 秒 | < 60 秒 | < 60 秒 | < 60 秒 | | [部署防護機制：藍/綠部署](deployment-guardrails.md) | ✓ | ✓ | ✓ | ✓ | | [部署防護機制：滾動部署](deployment-guardrails.md) | ✓ | ✓ | ✓ | ✓ | | [陰影測試](shadow-tests.md) | ✓ | | | | | 市場模型套件支援 | ✓ | | | | | Virtual Private Cloud 支援 | ✓ | ✓ | ✓ | ✓ | | 多種生產變體支援 | ✓ | | ✓ | ✓ | | 網路隔離 | ✓ | ✓ | ✓ | ✓ | | [模型並行服務支援](model-parallel-intro.md) | ✓ 3 | | ✓ 3 | | | 磁碟區加密 | ✓ | ✓ | ✓ | ✓ | | 客戶 AWS KMS | ✓ | ✓ | ✓ | ✓ | | d 執行個體支援 | ✓ | ✓ | ✓ | ✓ | | [inf1 支援](neo-supported-cloud.md) | ✓ | | | | 1 Amazon EC2 執行個體類型的可用性取決於 AWS 區域。如需特定執行個體的可用性 AWS，請參閱 [Amazon SageMaker AI 定價](https://aws.amazon.com/sagemaker/pricing/)。 2 若要使用其他任何架構或演算法，請使用 SageMaker AI 推論工具組來建置支援多模型端點的容器。 3 使用 SageMaker AI，您可以部署大型模型 (最大不超過 500 GB) 來進行推論。您可以設定容器的運作狀態檢查和下載逾時配額 (最多不超過 60 分鐘)。這可讓您有更多時間下載並載入您的模型和相關資源。如需詳細資訊，請參閱[大型模型推論的 SageMaker AI 端點參數](large-model-inference-hosting.md)。您可以使用 SageMaker AI 相容的[大型模型推論](https://github.com/aws/deep-learning-containers/blob/master/available_images.md#large-model-inference-containers)容器。您也可以使用第三方模型平行化程式庫，例如搭配 FasterTransformer 和 DeepSpeed 的 Triton。您必須確定它們與 SageMaker AI 相容。