本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
完成 SageMaker Canvas 中基礎模型的先決條件
以下各節概述了與基礎模型交互動以及在 Canvas 中使用文件查詢功能的先決條件。本頁面的其餘內容假設您已符合基礎模型的先決條件。文件查詢功能需要其他許可。
基礎模型的先決條件
與模型互動所需的許可包含在 Canvas 即用型模型許可中。若要在 Canvas 中使用生成式 AI 模型,您必須在設定 Amazon SageMaker AI 網域時開啟 Canvas 即用型模型組態許可。如需詳細資訊,請參閱設定 Amazon SageMaker Canvas 的先決條件。Canvas 即用型模型組態將 AmazonSageMakerCanvasAIServicesAccess 政策連接到了您的 Canvas 使用者的 AWS Identity and Access Management (IAM)執行角色。如果您在授予許可時遇到任何問題,請參閱主題針對透過 SageMaker AI 主控台授予許可的問題進行故障診斷。
如果您已設定網域,則可以編輯網域設定並開啟許可。如需如何編輯網域設定的指示,請參閱編輯網域設定。編輯網域的設定時,請前往 Canvas 設定,然後開啟啟用 Canvas 即用型模型選項。
某些 JumpStart 基礎模型也會要求您請求增加 SageMaker AI 執行個體配額。Canvas 會在這些執行個體上託管您目前與之互動的模型,但您的帳戶的預設配額可能不足。如果您在執行下列任何模型時發生錯誤,請求增加已關聯的執行個體類型的配額:
-
Falcon-40B –
ml.g5.12xlarge、ml.g5.24xlarge -
Falcon-13B –
ml.g5.2xlarge、ml.g5.4xlarge、ml.g5.8xlarge -
MPT-7B-Instruct -
ml.g5.2xlarge、ml.g5.4xlarge、ml.g5.8xlarge
針對前面的 執行個體類型,請求端點用量配額從 0 增加到 1。如需關於如何提高您的帳戶的執行個體配額更多相關資訊,請參閱 Service Quotas 使用者指南中的請求增加配額。
文件查詢的先決條件
注意
下列支援文件查詢 AWS 區域:美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (奧勒岡)、歐洲 (愛爾蘭)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (東京) 和亞太區域 (孟買)。
文件查詢功能要求您已經擁有儲存文件和文件中繼資料的 Amazon Kendra 索引。如需 Amazon Kendra 的更多相關資訊,請參閱 Amazon Kendra 開發人員指南。若要進一步了解查詢索引的配額,請參閱 Amazon Kendra 開發人員指南中的配額。
您還必須確保 Canvas 使用者設定檔具有文件查詢所需的許可。必須在託管 Canvas 應用程式的 SageMaker AI 網域上,將 AmazonSageMakerCanvasFullAccess 政策連接至 AWS IAM 執行角色 (此政策預設會連接至所有新的與現有 Canvas 使用者設定檔)。您還必須特別授予文件查詢許可,並指定對一或多個 Amazon Kendra 索引的存取權。
如果您的 Canvas 管理員正在設定新網域或使用者設定檔,請依照設定 Amazon SageMaker Canvas 的先決條件中的指示設定網域。在設定網域時,他們可以透過 Canvas 即用型模型組態開啟文件查詢許可。
Canvas 管理員也可以在使用者設定檔等級上管理文件查詢許可。例如,如果管理員想要將文件查詢許可授予某些使用者設定檔,但要移除其他使用者的權限,則他們可以編輯特定使用者的許可。
以下程序示範如何開啟特定使用者設定檔的文件查詢許可:
-
開啟位在 https://console.aws.amazon.com/sagemaker/
的 SageMaker AI 主控台。 -
在左側導覽窗格中,選擇管理員組態。
-
在管理員組態下,選擇網域。
-
從網域清單中選取使用者設定檔的網域。
-
在網域詳細資訊頁面上,選擇您要編輯其許可的使用者設定檔。
-
在 User Details (使用者詳細資訊) 頁面選擇 Edit (編輯)。
-
在左側導覽窗格中,選擇 Canvas 設定。
-
在 Canvas 即用型模型組態區段中,開啟啟用使用 Amazon Kendra 文件查詢切換開關。
-
在下拉式清單中,選取您要授予存取權的一個或多個 Amazon Kendra 索引。
-
選擇提交,將變更儲存至您的網域設定。
您現在應該可以使用 Canvas 基礎模型來查詢指定 Amazon Kendra 索引中的文件。