本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 上的全受管擷取增強產生選項 AWS
<a name="rag-fully-managed"></a>

若要管理 上的擷取增強產生 (RAG) 工作流程 AWS，您可以使用自訂 RAG 管道，或使用 AWS 提供的一些全受管服務功能。由於它們包含以 RAG 為基礎的系統的許多核心元件，全受管服務可協助您管理一些未區分的繁重工作。不過，這些服務提供較少的自訂機會。

全受管 AWS 服務 使用連接器從外部資料來源擷取資料，例如網站、Atlassian Confluence 或 Microsoft SharePoint。支援的資料來源因 而異 AWS 服務。

本節探討下列在 上建置 RAG 工作流程的全受管選項 AWS：
+ [Amazon Bedrock 的知識庫](rag-fully-managed-bedrock.md)
+ [Amazon Q Business](rag-fully-managed-q-business.md)
+ [Amazon SageMaker AI Canvas](rag-fully-managed-sagemaker-canvas.md)

如需如何在這些選項之間進行選擇的詳細資訊，請參閱本指南[在 上選擇擷取增強產生選項 AWS](choosing-option.md)中的 。

# Amazon Bedrock 的知識庫
<a name="rag-fully-managed-bedrock"></a>

[Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-bedrock.html) 是一項全受管服務，可讓您透過統一 API 使用來自領導級 AI 新創公司和 Amazon 的高效能基礎模型 (FMs)。[知識庫](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base.html)是一種 Amazon Bedrock 功能，可協助您實作從擷取到擷取和提示擴增的整個 RAG 工作流程。您不需要建立與資料來源的自訂整合或管理資料流程。工作階段內容管理是內建的，因此您的生成式 AI 應用程式可以輕鬆支援多轉對話。

在您指定資料的位置後，Amazon Bedrock 的知識庫會在內部擷取文件、將其區塊化為文字區塊、將文字轉換為內嵌，然後將內嵌內容存放在您選擇的向量資料庫中。Amazon Bedrock 會管理和更新內嵌項目，使向量資料庫與資料保持同步。如需知識庫如何運作的詳細資訊，請參閱 [Amazon Bedrock 知識庫如何運作](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-how-it-works.html)。

如果您將知識庫新增至 Amazon Bedrock 代理程式，代理程式會根據使用者輸入來識別適當的知識庫。代理程式會擷取相關資訊，並將資訊新增至輸入提示。更新的提示會提供模型更多內容資訊來產生回應。為了提高透明度並將幻覺降至最低，從知識庫擷取的資訊可追蹤至其來源。


![\[Amazon Bedrock 代理程式會從知識庫擷取資訊，並將其傳遞給 LLM。\]](http://docs.aws.amazon.com/zh_tw/prescriptive-guidance/latest/retrieval-augmented-generation-options/images/architecture-knowledge-base.png)


Amazon Bedrock 支援下列兩個適用於 RAG APIs：
+ [RetrieveAndGenerate](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html) – 您可以使用此 API 查詢您的知識庫，並從其擷取的資訊產生回應。在內部，Amazon Bedrock 會將查詢轉換為內嵌、查詢知識庫、使用搜尋結果增強提示做為內容資訊，並傳回 LLM 產生的回應。Amazon Bedrock 也會管理對話的短期記憶體，以提供更具體的結果。
+ [擷取](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html) – 您可以使用此 API，透過直接從知識庫擷取的資訊來查詢知識庫。您可以使用從此 API 傳回的資訊來處理擷取的文字、評估其相關性，或開發個別的工作流程來產生回應。在內部，Amazon Bedrock 會將查詢轉換為內嵌、搜尋知識庫，並傳回相關結果。您可以在搜尋結果之上建置其他工作流程。例如，您可以使用 [https://python.langchain.com/docs/integrations/retrievers/bedrock/](https://python.langchain.com/docs/integrations/retrievers/bedrock/) `AmazonKnowledgeBasesRetriever` 外掛程式將 RAG 工作流程整合到生成式 AI 應用程式。

如需使用 APIs 的範例架構模式和step-by-step說明，請參閱 [Amazon Bedrock 中的知識庫現在提供全受管 RAG 體驗](https://aws.amazon.com/blogs/aws/knowledge-bases-now-delivers-fully-managed-rag-experience-in-amazon-bedrock/) (AWS 部落格文章）。如需如何使用 `RetrieveAndGenerate` API 為智慧型聊天型應用程式建置 RAG 工作流程的詳細資訊，請參閱[使用 Amazon Bedrock 知識庫建置情境式聊天機器人應用程式](https://aws.amazon.com/blogs/machine-learning/build-a-contextual-chatbot-application-using-knowledge-bases-for-amazon-bedrock/) (AWS 部落格文章）。

## 知識庫的資料來源
<a name="rag-fully-managed-bedrock-data-sources"></a>

您可以將專屬資料連接到知識庫。設定資料來源連接器之後，您可以將資料與知識庫同步或保持最新狀態，並讓資料可供查詢。Amazon Bedrock 知識庫支援連線至下列資料來源：
+ [Amazon Simple Storage Service (Amazon S3)](https://docs.aws.amazon.com/bedrock/latest/userguide/s3-data-source-connector.html) – 您可以使用 主控台或 API，將 Amazon S3 儲存貯體連線至 Amazon Bedrock 知識庫。知識庫會擷取和索引儲存貯體中的檔案。這種資料來源類型支援下列功能：
  + **文件中繼資料欄位** – 您可以包含個別的檔案，以指定 Amazon S3 儲存貯體中檔案的中繼資料。然後，您可以使用這些中繼資料欄位來篩選和改善回應的相關性。
  + **包含或排除篩選條件** – 您可以在爬取時包含或排除特定內容。
  + **增量同步** – 會追蹤內容變更，而且只會爬取自上次同步以來變更的內容。
+ [https://docs.aws.amazon.com/bedrock/latest/userguide/confluence-data-source-connector.html](https://docs.aws.amazon.com/bedrock/latest/userguide/confluence-data-source-connector.html) – 您可以使用 主控台或 API 將Atlassian Confluence執行個體連線至 Amazon Bedrock 知識庫。這種資料來源類型支援下列功能：
  + **自動偵測主要文件欄位** – 會自動偵測和編目中繼資料欄位。您可以使用這些欄位進行篩選。
  + **包含或排除內容篩選條件** – 您可以在空格、頁面標題、部落格標題、註解、附件名稱或延伸上使用字首或規則表達式模式，來包含或排除特定內容。
  + **累加式同步** - 追蹤內容變更，而且只會爬取自上次同步以來變更的內容。
  + **OAuth 2.0 身分驗證，使用 Confluence API 字符進行身分驗證** – 身分驗證憑證會存放在其中 AWS Secrets Manager。
+ [https://docs.aws.amazon.com/bedrock/latest/userguide/sharepoint-data-source-connector.html](https://docs.aws.amazon.com/bedrock/latest/userguide/sharepoint-data-source-connector.html) – 您可以使用 主控台或 API 將SharePoint執行個體連線至知識庫。這種資料來源類型支援下列功能：
  + **自動偵測主要文件欄位** – 會自動偵測和爬取中繼資料欄位。您可以使用這些欄位進行篩選。
  + **包含或排除內容篩選條件** – 您可以在主頁面標題、事件名稱和檔案名稱 （包括其副檔名） 上使用字首或規則表達式模式來包含或排除特定內容。
  + **增量同步 **- 追蹤內容變更，並且只會爬取自上次同步以來變更的內容。
  + **OAuth 2.0 身分驗證** – 身分驗證憑證存放在其中 AWS Secrets Manager。
+ [https://docs.aws.amazon.com/bedrock/latest/userguide/salesforce-data-source-connector.html](https://docs.aws.amazon.com/bedrock/latest/userguide/salesforce-data-source-connector.html) – 您可以使用 主控台或 API 將Salesforce執行個體連線至知識庫。這種資料來源類型支援下列功能：  
  + **自動偵測主要文件欄位** – 會自動偵測和編目中繼資料欄位。您可以使用這些欄位進行篩選。
  + **包含或排除內容篩選條件** – 您可以使用字首或規則表達式模式來包含或排除特定內容。如需可套用篩選條件的內容類型清單，請參閱 [Amazon Bedrock 文件](https://docs.aws.amazon.com/bedrock/latest/userguide/salesforce-data-source-connector.html#configuration-salesforce-connector)中的*包含/排除篩選條件*。
  + **增量同步 –** 會追蹤內容變更，而且只會爬取自上次同步以來變更的內容。
  + **OAuth 2.0 身分**驗證 – 身分驗證憑證存放在其中 AWS Secrets Manager。
+ [Web 爬蟲程式](https://docs.aws.amazon.com/bedrock/latest/userguide/webcrawl-data-source-connector.html) – Amazon Bedrock Web 爬蟲程式會連接至您提供的 URLs並進行爬蟲。支援下列功能：
  + 選取要爬取URLs 
  + 遵守標準 robots.txt 指令，例如 `Allow`和 `Disallow`
  + 排除符合模式URLs 
  + 限制爬取的速率
  + 在 Amazon CloudWatch 中，檢視每個抓取 URL 的狀態

如需可連線至 Amazon Bedrock 知識庫之資料來源的詳細資訊，請參閱[為您的知識庫建立資料來源連接器](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html)。

## 知識庫的向量資料庫
<a name="rag-fully-managed-bedrock-vector-stores"></a>

當您設定知識庫與資料來源之間的連線時，您必須設定向量資料庫，也稱為*向量存放區*。向量資料庫是 Amazon Bedrock 存放、更新和管理代表您資料的內嵌項目的地方。每個資料來源都支援不同類型的向量資料庫。若要判斷您的資料來源可使用哪些向量資料庫，請參閱[資料來源類型](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html)。

如果您希望 Amazon Bedrock 自動為您在 Amazon OpenSearch Serverless 中建立向量資料庫，您可以在建立知識庫時選擇此選項。不過，您也可以選擇設定自己的向量資料庫。如果您設定自己的向量資料庫，請參閱[您自己的向量存放區的先決條件以取得知識庫](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-setup.html)。每種類型的向量資料庫都有自己的先決條件。

根據您的資料來源類型，Amazon Bedrock 知識庫支援下列向量資料庫：
+ [Amazon OpenSearch Serverless](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-vector-search.html)
+ [Amazon Aurora PostgreSQL-Compatible Edition](https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/AuroraPostgreSQL.VectorDB.html)
+ [https://docs.pinecone.io/docs/amazon-bedrock](https://docs.pinecone.io/docs/amazon-bedrock) (Pinecone 文件）
+ [https://docs.redis.com/latest/rc/cloud-integrations/aws-marketplace/aws-bedrock/](https://docs.redis.com/latest/rc/cloud-integrations/aws-marketplace/aws-bedrock/) (Redis 文件）
+ [https://dochub.mongodb.org/core/amazon-bedrock](https://dochub.mongodb.org/core/amazon-bedrock) (MongoDB 文件）

# Amazon Q Business
<a name="rag-fully-managed-q-business"></a>

[Amazon Q Business](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/what-is.html) 是全受管、生成式 AI 支援的助理，您可以設定 來回答問題、提供摘要、產生內容，以及根據您的企業資料完成任務。它允許最終使用者從具有引文的企業資料來源接收立即的許可感知回應。

## 主要功能
<a name="rag-fully-managed-q-business-features"></a>

Amazon Q Business 的下列功能可協助您建置生產級 RAG 型生成式 AI 應用程式：
+ **內建連接器** – Amazon Q Business 支援超過 40 種類型的連接器，例如 Adobe Experience Manager (AEM)、Jira、 Salesforce和 的連接器Microsoft SharePoint。如需完整清單，請參閱[支援的連接器](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/connectors-list.html)。如果您需要不支援的連接器，您可以使用 [Amazon AppFlow](https://docs.aws.amazon.com/appflow/latest/userguide/what-is-appflow.html) 將資料來源中的資料提取至 Amazon Simple Storage Service (Amazon S3)，然後將 Amazon Q Business 連線至 Amazon S3 儲存貯體。如需 Amazon AppFlow 支援的資料來源完整清單，請參閱[支援的應用程式](https://docs.aws.amazon.com/appflow/latest/userguide/app-specific.html)。
+ **內建索引管道** – Amazon Q Business 提供內建管道，用於編製向量資料庫中資料的索引。您可以使用 AWS Lambda 函數為索引管道新增預先處理邏輯。
+ **索引選項** – 您可以在 Amazon Q Business 中建立和佈建原生索引，並使用 Amazon Q Business 擷取器從該索引提取資料。或者，您可以使用預先設定的 Amazon Kendra 索引做為擷取器。如需詳細資訊，請參閱[為 Amazon Q Business 應用程式建立擷取器](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/select-retriever.html)。
+ **基礎模型** – Amazon Q Business 使用 Amazon Bedrock 支援的基礎模型。如需完整清單，請參閱 [Amazon Bedrock 中支援的基礎模型](https://docs.aws.amazon.com/bedrock/latest/userguide/models-supported.html)。
+ **外掛程式** – Amazon Q Business 提供使用外掛程式與目標系統整合的功能，例如在 中摘要票證資訊和建立票證的自動化方式Jira。設定完成後，外掛程式可以支援讀取和寫入動作，協助您提高最終使用者的生產力。Amazon Q Business 支援兩種類型的外掛程式：[內建外掛程式](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/built-in-plugin.html)和[自訂外掛程式](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/custom-plugin.html)。
+ **護欄** – Amazon Q Business 支援全域控制和主題層級控制。例如，這些控制項可以在提示中偵測個人身分識別資訊 (PII)、濫用或敏感資訊。如需詳細資訊，請參閱 [Amazon Q Business 中的管理員控制項和護欄](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/guardrails.html)。
+ **身分管理** – 透過 Amazon Q Business，您可以管理使用者及其對 RAG 型生成式 AI 應用程式的存取。如需詳細資訊，請參閱 [Amazon Q Business 的身分和存取管理](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/security-iam.html)。此外，Amazon Q Business 連接器索引存取控制清單 (ACL) 資訊會與文件本身一起連接至文件。然後，Amazon Q Business 會將索引的 ACL 資訊存放在 Amazon Q Business User Store 中，以建立使用者和群組映射，並根據最終使用者對文件的存取篩選聊天回應。如需詳細資訊，請參閱[資料來源連接器概念](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/connector-concepts.html)。
+ **文件擴充** – 文件擴充功能可協助您控制**哪些**文件和文件屬性會擷取到您的索引，以及如何擷取****它們。這可以透過兩種方法完成：
  + **設定基本操作 **– 使用基本操作來新增、更新或刪除資料中的文件屬性。例如，您可以選擇刪除與 PII 相關的任何文件屬性，以清除 PII 資料。
  + **設定 Lambda 函數 **– 使用預先設定的 Lambda 函數，對資料執行更自訂的進階文件屬性操作邏輯。例如，您企業的部分資料可能以掃描影像形式儲存。在這種情況下，您可以使用 Lambda 函數在掃描的文件上執行光學字元辨識 (OCR)，從中擷取文字。後續在資料匯入期間，每份掃描文件都會視為文字文件處理。最後，在聊天期間，Amazon Q 會在產生回應時考量從掃描文件擷取的文字資料。

  實作解決方案時，您可以選擇結合兩種文件擴充方法。您可以使用基本操作來執行資料的第一個剖析，然後使用 Lambda 函數進行更複雜的操作。如需詳細資訊，請參閱 [Amazon Q Business 中的文件擴充](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/custom-document-enrichment.html)。
+ **整合** – 建立 Amazon Q Business 應用程式後，您可以將其整合到其他應用程式，例如 Slack或 Microsoft Teams。例如，請參閱[部署 forAmazonSlack閘道](https://aws.amazon.com/blogs/machine-learning/deploy-a-slack-gateway-for-amazon-q-your-business-expert/)和[部署 Amazon Q Business 的Microsoft Teams閘道](https://aws.amazon.com/blogs/machine-learning/deploy-a-microsoft-teams-gateway-for-amazon-q-your-business-expert/) (AWS 部落格文章）。

## 最終使用者自訂
<a name="rag-fully-managed-q-business-customization"></a>

Amazon Q Business 支援上傳可能不會存放在組織資料來源和索引中的文件。上傳的文件不會儲存。它們僅適用於上傳文件的對話。Amazon Q Business 支援用於上傳的特定文件類型。如需詳細資訊，請參閱在 [Amazon Q Business 中上傳檔案和聊天](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/upload-chat-files.html)。

Amazon Q Business [包含依文件屬性功能的篩選](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/metadata-filtering.html)。管理員和最終使用者可以使用此功能。管理員可以使用 屬性自訂和控制最終使用者的聊天回應。例如，如果資料來源類型是連接至文件的屬性，您可以指定僅從特定資料來源產生聊天回應。或者，您可以使用您選取的屬性篩選條件，允許最終使用者限制聊天回應的範圍。

最終使用者可以在更廣泛的 [Amazon Q Business 應用程式](https://docs.aws.amazon.com/amazonq/latest/qbusiness-ug/purpose-built-qapps.html)環境中建立輕量型專用 Amazon Q 應用程式。Amazon Q 應用程式允許特定網域的任務自動化，例如專為行銷團隊打造的應用程式。

# Amazon SageMaker AI Canvas
<a name="rag-fully-managed-sagemaker-canvas"></a>

[Amazon SageMaker AI Canvas](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas.html) 可協助您使用機器學習產生預測，而無需撰寫任何程式碼。它提供無程式碼視覺化界面，可讓您準備資料、建置和部署 ML 模型，簡化統一環境中end-to-end ML 生命週期。資料準備、模型開發、偏差偵測、可解釋性和監控的複雜性會在直覺式界面後方抽象化。使用者不需要是 SageMaker AI 或機器學習操作 (MLOps) 專家，即可使用 SageMaker AI Canvas 開發、操作和監控模型。

使用 SageMaker AI Canvas 時，RAG 功能是透過無程式碼的文件查詢功能提供。您可以使用 Amazon Kendra 索引作為基礎企業搜尋，豐富 SageMaker AI Canvas 中的聊天體驗。如需詳細資訊，請參閱[使用文件查詢從文件擷取資訊](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-fm-chat-query.html)。

將 SageMaker AI Canvas 連接到 Amazon Kendra 索引需要一次性設定。做為網域組態的一部分，雲端管理員可以選擇一或多個 Kendra 索引，供使用者在與 SageMaker Canvas 互動時查詢。如需如何啟用文件查詢功能的指示，請參閱[開始使用 Amazon SageMaker AI Canvas](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-getting-started.html)。

SageMaker AI Canvas 會管理 Amazon Kendra 與所選基礎模型之間的基礎通訊。如需有關 SageMaker AI Canvas 支援的基礎模型的詳細資訊，請參閱 [ SageMaker AI Canvas 中的生成式 AI 基礎模型](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-fm-chat.html)。下圖顯示雲端管理員將 SageMaker AI Canvas 連線至 Amazon Kendra 索引後，文件查詢功能的運作方式。


![\[Amazon SageMaker AI Canvas 中文件查詢功能的工作流程。\]](http://docs.aws.amazon.com/zh_tw/prescriptive-guidance/latest/retrieval-augmented-generation-options/images/architecture-sagemaker-canvas-document-querying.png)


該圖顯示以下工作流程：

1. 使用者在 SageMaker AI Canvas 中開始新的聊天，開啟**查詢文件**，選取目標索引，然後提交問題。

1. SageMaker AI Canvas 使用查詢來搜尋 Amazon Kendra 索引以取得相關資料。

1. SageMaker AI Canvas 會從 Amazon Kendra 索引擷取資料及其來源。

1. SageMaker AI Canvas 會更新提示，以包含從 Amazon Kendra 索引擷取的內容，並將提示提交至基礎模型。

1. 基礎模型使用原始問題和擷取的內容來產生答案。

1. SageMaker AI Canvas 為使用者提供產生的答案。它包含對資料來源的參考，例如用來產生回應的文件。