

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 在 上選擇擷取增強產生選項 AWS
<a name="choosing-option"></a>

本指南的[全受管 RAG 選項](rag-fully-managed.md)和[自訂 RAG 架構](rag-custom.md)章節描述了在其中建置以 RAG 為基礎的搜尋解決方案的各種方法 AWS。本節說明如何根據您的使用案例在這些選項之間進行選擇。在某些情況下，可能會使用多個選項。在這種情況下，選擇取決於易於實作、組織中可用的技能，以及您公司的政策和標準。

我們建議您考慮以下順序中的全受管和自訂 RAG 選項，並選擇適合您使用案例的第一個選項：

1. 使用 [Amazon Q Business](rag-fully-managed-q-business.md)，除非：
   + 您的 中無法使用此服務 AWS 區域，而且您的資料無法移至可使用該服務的區域
   + 您有特定原因可自訂 RAG 工作流程
   + 您想要使用現有的向量資料庫或特定的 LLM

1. 使用 [Amazon Bedrock 的知識庫](rag-fully-managed-bedrock.md)，除非：
   + 您有不支援的向量資料庫
   + 您有特定原因可自訂 RAG 工作流程

1. 將 [Amazon Kendra](rag-custom-retrievers.md#rag-custom-kendra) 與您選擇的[產生器](rag-custom-generators.md)結合，除非：
   + 您想要選擇自己的向量資料庫
   + 您想要自訂區塊化策略

1. 如果您想要對擷取器進行更多控制，並想要選取自己的向量資料庫：
   + 如果您沒有現有的向量資料庫，而且不需要低延遲或圖形查詢，請考慮使用 [Amazon OpenSearch Service](rag-custom-retrievers.md#rag-custom-opensearch)。
   + 如果您有現有的PostgreSQL向量資料庫，請考慮使用 [Amazon Aurora PostgreSQL 和 pgvector](rag-custom-retrievers.md#rag-custom-aurora) 選項。
   + 如果您需要低延遲，請考慮記憶體內選項，例如 [Amazon MemoryDB](rag-custom-retrievers.md#rag-custom-memorydb) 或 [Amazon DocumentDB](rag-custom-retrievers.md#rag-custom-docdb)。
   + 如果您想要將向量搜尋與圖形查詢結合，請考慮使用 [Amazon Neptune Analytics](rag-custom-retrievers.md#rag-custom-neptune)。
   + 如果您已經在使用第三方向量資料庫或從中尋找特定利益，請考慮 [Pinecone](rag-custom-retrievers.md#rag-custom-pinecone)、 [MongoDB Atlas](rag-custom-retrievers.md#rag-custom-mongodb-atlas)和 [Weaviate](rag-custom-retrievers.md#rag-custom-weaviate)。

1. 如果您想要選擇 LLM：
   + 如果您使用 Amazon Q Business，則無法選擇 LLM。
   + 如果您使用 Amazon Bedrock，您可以選擇其中一個[支援的基礎模型](https://docs.aws.amazon.com/bedrock/latest/userguide/models-supported.html)。
   + 如果您使用 Amazon Kendra 或自訂向量資料庫，您可以使用本指南所述的其中一個[產生器](rag-custom-generators.md)，或使用自訂 LLM。
**注意**  
您也可以使用自訂文件來微調現有的 LLM，以提高其回應的準確性。如需詳細資訊，請參閱本指南中的 [比較 RAG 和微調](rag-vs-fine-tuning.md)。

1. 如果您有想要使用的 Amazon SageMaker AI Canvas 現有實作，或想要比較不同 LLMs RAG 回應，請考慮 [Amazon SageMaker AI Canvas](rag-fully-managed-sagemaker-canvas.md)。