

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 將模型部署到端點
<a name="canvas-deploy-model"></a>

您可以在 Amazon SageMaker Canvas 中將模型部署到端點以進行預測。SageMaker AI 提供 ML 基礎設施，讓您可以在自己所選且具有運算執行個體的端點上託管模型。然後您可以*調用*端點 (發送預測請求) 並從模型中獲取即時預測。您可以透過此功能在生產環境中使用模型來回應傳入請求，並且可以將模型與現有應用程式和工作流程整合。

若要開始使用，您應該具有一個您想要部署的模型。您可以部署已建置的自訂模型版本、Amazon SageMaker JumpStart 基礎模型，以及微調的 JumpStart 基礎模型。如需在 Canvas 中建立模型的更多相關資訊，請參閱[自訂模型的運作方式](canvas-build-model.md)。如需 Canvas 中 JumpStart 基礎模型的詳細資訊，請參閱 [SageMaker Canvas 中的生成式 AI 基礎模型](canvas-fm-chat.md)。

檢閱下列**許可管理**章節，然後在**部署模型**區段中開始建立新的部署。

## 許可管理
<a name="canvas-deploy-model-prereqs"></a>

根據預設，您具有將模型部署到 SageMaker AI 託管端點的許可。SageMaker AI 透過連接至 AWS IAM 執行角的 [AmazonSageMakerCanvasFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerCanvasFullAccess.html) 政策，為所有新的與現有 Canvas 使用者設定檔授與託管 Canvas 應用程式的 SageMaker AI 網域許可。

如果 Canvas 管理員正在設定新網域或使用者設定檔，當他們設定網域並遵循[設定 Amazon SageMaker Canvas 的先決條件](canvas-getting-started.md#canvas-prerequisites)中的先決條件指示時，SageMaker AI 會透過預設為啟用的**啟用 Canvas 模型直接部署**選項，開啟模型註冊許可。

Canvas 管理員也可以在使用者設定檔等級上管理模型部署許可。例如，如果管理員在設定網域時不想要將模型部署許可授予所有使用者設定檔，他們可以在建立網域之後將許可授予特定使用者。

以下程序展示如何修改特定使用者設定檔的模型部署許可：

1. 開啟位在 [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/) 的 SageMaker AI 主控台。

1. 在左側導覽窗格中，選擇**管理員組態**。

1. 在 **Admin configurations** (管理員組態) 下，選擇 **Domains** (網域)。

1. 從網域清單中選取使用者設定檔的網域。

1. 在**網域詳細資訊**頁面上，選擇**使用者設定檔**索引標籤。

1. 選擇您的**使用者設定檔**。

1. 在使用者設定檔的頁面上，選取**應用程式組態**索引標籤。

1. 在 **Canvas** 區段中，選擇**編輯**。

1. 在 **ML Ops 組態**區段中，開啟**啟用 Canvas 模型直接部署**切換，以啟用部署許可。

1. 選擇**提交**，將變更儲存至您的網域設定。

使用者設定檔現在應該具有模型部署許可。

將許可授予網域或使用者設定檔後，請確定使用者登出其 Canvas 應用程式，然後重新登入以套用許可變更。

## 部署模型
<a name="canvas-deploy-model-deploy"></a>

若要開始部署模型，請在 Canvas 中建立新部署，並指定要與機器學習 (ML) 基礎設施一起部署的模型版本，例如您想要用來託管模型的運算執行個體的類型和數目。

Canvas 會根據您的模型類型建議預設類型和執行個體數目，或者您也可以在 [Amazon SageMaker 定價頁面](https://aws.amazon.com/sagemaker/pricing/)上進一步了解各種 SageMaker AI 執行個體類型。在端點處於作用中狀態時，系統會根據 SageMaker AI 執行個體定價向您收費。

部署 JumpStart 基礎模型時，您也可以選擇指定部署時間的長度。您可以無限期地將模型部署到端點 (表示端點在您刪除部署之前一直處於作用中狀態)。或者，如果您只需要短暫使用端點並希望降低成本，則可以將模型部署到端點一段指定的時間，之後 SageMaker AI 會為您關閉該端點。

**注意**  
如果部署模型一段指定的時間，請在端點持續時間內保持登入 Canvas 應用程式。如果您登出或刪除應用程式，則 Canvas 無法在指定的時間關閉端點。

將模型部署到 SageMaker AI 託管[即時推論端點](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html)後，您可以透過*調用*端點開始進行預測。

有幾種不同的方法可讓您從 Canvas 應用程式部署模型。您可以透過下列任一種方法來存取模型部署選項：
+ 在 Canvas 應用程式的**我的模型**頁面上，選擇您要部署的模型。然後，從模型的**版本**面中，選擇模型版本旁邊的**更多選項**圖示 (![Vertical ellipsis icon representing a menu or more options.](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選取**部署**。
+ 在模型版本的詳細資訊頁面上，請在**分析**索引標籤上選擇**部署**選項。
+ 在模型版本的詳細資訊頁面上，請在**預測**索引標籤上選擇頁面頂端的**更多選項**圖示 (![](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選取**部署**。
+ 在 Canvas 應用程式的 **ML Ops** 頁面上，選擇**部署**索引標籤，然後選擇**建立部署**。
+ 對於 JumpStart 基礎模型和微調基礎模型，請前往 Canvas 應用程式的**即用型模型**頁面。選擇**產生、擷取與摘要內容**。然後，尋找您要部署的 JumpStart 基礎模型或微調基礎模型。選擇模型，然後在模型的聊天頁面上，選擇**部署**按鈕。

這些方法都會開啟 **Deploy model** (部署模型) 側邊面板，您可以在其中指定模型的部署組態。若要從此面板部署模型，請執行下列動作：

1. (選用) 如果您要從 **ML Ops** 頁面建立部署，則可以選擇**選取模型和版本**。使用下拉式清單功能表選取您要部署的模型和模型版本。

1. 在 **Deployment Name** (部署名稱) 欄位中輸入名稱。

1. (僅適用於 JumpStart 基礎模型和微調基礎模型) 選擇**部署長度**。選取**無限期**以讓端點保持作用中狀態，直到您將其關閉為止，或選取**指定長度**，然後輸入您要讓端點保持作用中狀態的時段。

1. 針對**執行個體類型**，SageMaker AI 會偵測適合您模型的預設執行個體類型和數量。但是，您可以變更想要用於託管模型的執行個體類型。
**注意**  
如果您 AWS 帳戶中所選執行個體類型的執行個體配額用盡，您可以請求增加配額。如需預設配額以及如何請求提高配額的詳細資訊，請參閱《AWS 一般參考指南》**中的 [Amazon SageMaker AI 端點和配額](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html)。

1. 針對**Instance count** (執行個體計數)，您可以設定用於端點的作用中執行個體數目。SageMaker AI 會偵測適合您模型的預設數目，但您可以變更此數字。

1. 當您準備好部署模型時，請選擇 **Deploy** (部署)。

您的模型現在應該部署到端點。