

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Memilih opsi Retrieval Augmented Generation di AWS
<a name="choosing-option"></a>

[Opsi RAG yang dikelola sepenuhnya](rag-fully-managed.md) dan bagian [arsitektur RAG Kustom](rag-custom.md) dari panduan ini menjelaskan berbagai pendekatan untuk membangun solusi pencarian berbasis RAG. AWS Bagian ini menjelaskan cara memilih di antara opsi-opsi ini berdasarkan kasus penggunaan Anda. Dalam beberapa situasi, lebih dari satu opsi mungkin berhasil. Dalam skenario itu, pilihan tergantung pada kemudahan implementasi, keterampilan yang tersedia di organisasi Anda, dan kebijakan dan standar perusahaan Anda.

Kami menyarankan Anda mempertimbangkan opsi RAG yang dikelola sepenuhnya dan kustom dalam urutan berikut dan memilih opsi pertama yang sesuai dengan kasus penggunaan Anda:

1. Gunakan [Amazon Q Business](rag-fully-managed-q-business.md) kecuali:
   + Layanan ini tidak tersedia di Anda Wilayah AWS, dan data Anda tidak dapat dipindahkan ke Wilayah yang tersedia
   + Anda memiliki alasan khusus untuk menyesuaikan alur kerja RAG
   + Anda ingin menggunakan database vektor yang ada atau LLM tertentu

1. Gunakan [basis pengetahuan untuk Amazon Bedrock](rag-fully-managed-bedrock.md) kecuali:
   + Anda memiliki database vektor yang tidak didukung
   + Anda memiliki alasan khusus untuk menyesuaikan alur kerja RAG

1. Gabungkan [Amazon Kendra](rag-custom-retrievers.md#rag-custom-kendra) dengan [generator](rag-custom-generators.md) pilihan Anda kecuali:
   + Anda ingin memilih database vektor Anda sendiri
   + Anda ingin menyesuaikan strategi chunking

1. Jika Anda ingin lebih banyak kontrol atas retriever dan ingin memilih database vektor Anda sendiri:
   + Jika Anda tidak memiliki database vektor yang ada dan tidak memerlukan latensi rendah atau kueri grafik, pertimbangkan untuk menggunakan [Amazon OpenSearch ](rag-custom-retrievers.md#rag-custom-opensearch) Service.
   + Jika Anda memiliki database PostgreSQL vektor yang ada, pertimbangkan untuk menggunakan [Amazon Aurora PostgreSQL](rag-custom-retrievers.md#rag-custom-aurora) dan opsi. pgvector
   + [Jika Anda membutuhkan latensi rendah, pertimbangkan opsi dalam memori, seperti Amazon [MemoryDB atau Amazon](rag-custom-retrievers.md#rag-custom-memorydb) DocumentDB.](rag-custom-retrievers.md#rag-custom-docdb)
   + Jika Anda ingin menggabungkan pencarian vektor dengan kueri grafik, pertimbangkan [Amazon Neptunus](rag-custom-retrievers.md#rag-custom-neptune) Analytics.
   + Jika Anda sudah menggunakan database vektor pihak ketiga atau menemukan manfaat tertentu darinya, pertimbangkan [Pinecone[MongoDB Atlas](rag-custom-retrievers.md#rag-custom-mongodb-atlas)](rag-custom-retrievers.md#rag-custom-pinecone), dan [Weaviate](rag-custom-retrievers.md#rag-custom-weaviate).

1. Jika Anda ingin memilih LLM:
   + Jika Anda menggunakan Amazon Q Business, Anda tidak dapat memilih LLM.
   + Jika Anda menggunakan Amazon Bedrock, Anda dapat memilih salah satu [model pondasi yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/models-supported.html).
   + Jika Anda menggunakan Amazon Kendra atau database vektor kustom, Anda dapat menggunakan salah satu [generator](rag-custom-generators.md) yang dijelaskan dalam panduan ini atau menggunakan LLM kustom.
**catatan**  
Anda juga dapat menggunakan dokumen kustom Anda untuk menyempurnakan LLM yang ada untuk meningkatkan akurasi tanggapannya. Untuk informasi selengkapnya, lihat [Membandingkan RAG dan fine-tuning](rag-vs-fine-tuning.md) dalam panduan ini.

1. Jika Anda memiliki implementasi Amazon SageMaker AI Canvas yang ingin Anda gunakan atau jika Anda ingin membandingkan respons RAG dari yang berbeda LLMs, pertimbangkan [Amazon SageMaker AI Canvas](rag-fully-managed-sagemaker-canvas.md).