

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Bases de Conhecimento para Amazon Bedrock
<a name="rag-fully-managed-bedrock"></a>

[O Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-bedrock.html) é um serviço totalmente gerenciado que disponibiliza modelos básicos de alto desempenho (FMs) das principais startups de IA e da Amazon para seu uso por meio de uma API unificada. [As bases de conhecimento](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base.html) são um recurso do Amazon Bedrock que ajuda você a implementar todo o fluxo de trabalho do RAG, desde a ingestão até a recuperação e o aumento imediato. Não há necessidade de criar integrações personalizadas com fontes de dados ou gerenciar fluxos de dados. O gerenciamento do contexto da sessão é incorporado para que seu aplicativo generativo de IA possa suportar prontamente conversas em vários turnos.

Depois de especificar a localização dos seus dados, as bases de conhecimento do Amazon Bedrock buscam internamente os documentos, os fragmentam em blocos de texto, convertem o texto em incorporações e, em seguida, armazenam as incorporações no banco de dados vetorial de sua escolha. O Amazon Bedrock gerencia e atualiza as incorporações, mantendo o banco de dados vetoriais sincronizado com os dados. Para obter mais informações sobre como as bases de conhecimento funcionam, consulte [Como funcionam as bases de conhecimento Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-how-it-works.html).

Se você adicionar bases de conhecimento a um agente do Amazon Bedrock, o agente identificará a base de conhecimento apropriada com base na entrada do usuário. O agente recupera as informações relevantes e as adiciona ao prompt de entrada. O prompt atualizado fornece ao modelo mais informações de contexto para gerar uma resposta. Para melhorar a transparência e minimizar as alucinações, as informações recuperadas da base de conhecimento podem ser rastreadas até sua fonte.



![\[O agente Amazon Bedrock recupera informações da base de conhecimento e as passa para o LLM.\]](http://docs.aws.amazon.com/pt_br/prescriptive-guidance/latest/retrieval-augmented-generation-options/images/architecture-knowledge-base.png)


O Amazon Bedrock oferece suporte aos dois seguintes APIs para RAG:
+ [RetrieveAndGenerate](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)— Você pode usar essa API para consultar sua base de conhecimento e gerar respostas a partir das informações que ela recupera. Internamente, o Amazon Bedrock converte as consultas em incorporações, consulta a base de conhecimento, aumenta a solicitação com os resultados da pesquisa como informações de contexto e retorna a resposta gerada pelo LLM. O Amazon Bedrock também gerencia a memória de curto prazo da conversa para fornecer resultados mais contextuais.
+ [Recuperar](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html) — Você pode usar essa API para consultar sua base de conhecimento com informações recuperadas diretamente da base de conhecimento. Você pode usar as informações retornadas dessa API para processar o texto recuperado, avaliar sua relevância ou desenvolver um fluxo de trabalho separado para geração de respostas. Internamente, o Amazon Bedrock converte as consultas em incorporações, pesquisa na base de conhecimento e retorna os resultados relevantes. Você pode criar fluxos de trabalho adicionais com base nos resultados da pesquisa. Por exemplo, você pode usar o [https://python.langchain.com/docs/integrations/retrievers/bedrock/](https://python.langchain.com/docs/integrations/retrievers/bedrock/)`AmazonKnowledgeBasesRetriever`plug-in para integrar fluxos de trabalho do RAG em aplicativos generativos de IA.

Para exemplos de padrões arquitetônicos e step-by-step instruções de uso do APIs, consulte O [Knowledge Bases agora oferece uma experiência RAG totalmente gerenciada no Amazon Bedrock](https://aws.amazon.com/blogs/aws/knowledge-bases-now-delivers-fully-managed-rag-experience-in-amazon-bedrock/) (postagem no AWS blog). Para obter mais informações sobre como usar a `RetrieveAndGenerate` API para criar um fluxo de trabalho RAG para um aplicativo inteligente baseado em bate-papo, consulte [Criar um aplicativo de chatbot contextual usando o Amazon Bedrock Knowledge](https://aws.amazon.com/blogs/machine-learning/build-a-contextual-chatbot-application-using-knowledge-bases-for-amazon-bedrock/) Bases (postagem no blog).AWS 

## Fontes de dados para bases de conhecimento
<a name="rag-fully-managed-bedrock-data-sources"></a>

É possível conectar os dados proprietários a uma base de conhecimento. Depois de configurar um conector de fonte de dados, você pode sincronizar ou manter seus dados atualizados com sua base de conhecimento e disponibilizá-los para consulta. As bases de conhecimento do Amazon Bedrock oferecem suporte a conexões com as seguintes fontes de dados:
+ [Amazon Simple Storage Service (Amazon S3](https://docs.aws.amazon.com/bedrock/latest/userguide/s3-data-source-connector.html)) — Você pode conectar um bucket do Amazon S3 a uma base de conhecimento do Amazon Bedrock usando o console ou a API. A base de conhecimento ingere e indexa os arquivos no bucket. Esse tipo de fonte de dados oferece suporte aos seguintes recursos:
  + **Campos de metadados do documento** — Você pode incluir um arquivo separado para especificar os metadados dos arquivos no bucket do Amazon S3. Em seguida, você pode usar esses campos de metadados para filtrar e melhorar a relevância das respostas.
  + **Filtros de inclusão ou exclusão** — você pode incluir ou excluir determinados conteúdos durante o rastreamento.
  + **Sincronização incremental** — As alterações do conteúdo são monitoradas e somente o conteúdo que foi alterado desde a última sincronização é rastreado.
+ [https://docs.aws.amazon.com/bedrock/latest/userguide/confluence-data-source-connector.html](https://docs.aws.amazon.com/bedrock/latest/userguide/confluence-data-source-connector.html)— Você pode conectar uma Atlassian Confluence instância a uma base de conhecimento do Amazon Bedrock usando o console ou a API. Esse tipo de fonte de dados oferece suporte aos seguintes recursos:
  + **Detecção automática dos campos do documento principal** — Os campos de metadados são detectados e rastreados automaticamente. Você pode usar esses campos para filtragem.
  + **Filtros de conteúdo de inclusão ou exclusão** — Você pode incluir ou excluir determinados conteúdos usando um prefixo ou um padrão de expressão regular no espaço, título da página, título do blog, comentário, nome do anexo ou extensão.
  + **Sincronização incremental** - As alterações do conteúdo são monitoradas e somente o conteúdo que foi alterado desde a última sincronização é rastreado.
  + **OAuth Autenticação 2.0, autenticação com token de Confluence API** — As credenciais de autenticação são armazenadas em AWS Secrets Manager.
+ [https://docs.aws.amazon.com/bedrock/latest/userguide/sharepoint-data-source-connector.html](https://docs.aws.amazon.com/bedrock/latest/userguide/sharepoint-data-source-connector.html)— Você pode conectar uma SharePoint instância a uma base de conhecimento usando o console ou a API. Esse tipo de fonte de dados oferece suporte aos seguintes recursos:
  + **Detecção automática dos campos do documento principal** — Os campos de metadados são detectados e rastreados automaticamente. Você pode usar esses campos para filtragem.
  + **Filtros de conteúdo de inclusão ou exclusão** — Você pode incluir ou excluir determinado conteúdo usando um prefixo ou um padrão de expressão regular no título da página principal, no nome do evento e no nome do arquivo (incluindo sua extensão).
  + **Sincronização incremental** - As alterações do conteúdo são monitoradas e somente o conteúdo que foi alterado desde a última sincronização é rastreado.
  + **OAuth Autenticação 2.0** — As credenciais de autenticação são armazenadas em AWS Secrets Manager.
+ [https://docs.aws.amazon.com/bedrock/latest/userguide/salesforce-data-source-connector.html](https://docs.aws.amazon.com/bedrock/latest/userguide/salesforce-data-source-connector.html)— Você pode conectar uma Salesforce instância a uma base de conhecimento usando o console ou a API. Esse tipo de fonte de dados oferece suporte aos seguintes recursos:   
  + **Detecção automática dos campos do documento principal** — Os campos de metadados são detectados e rastreados automaticamente. Você pode usar esses campos para filtragem.
  + **Filtros de conteúdo de inclusão ou exclusão** — Você pode incluir ou excluir determinado conteúdo usando um prefixo ou um padrão de expressão regular. [Para obter uma lista dos tipos de conteúdo aos quais você pode aplicar filtros, consulte Filtros de *inclusão/exclusão na* documentação do Amazon Bedrock.](https://docs.aws.amazon.com/bedrock/latest/userguide/salesforce-data-source-connector.html#configuration-salesforce-connector)
  + **Sincronização incremental** — As alterações do conteúdo são monitoradas e somente o conteúdo que foi alterado desde a última sincronização é rastreado.
  + **OAuth Autenticação 2.0** — As credenciais de autenticação são armazenadas em AWS Secrets Manager.
+ [Web Crawler](https://docs.aws.amazon.com/bedrock/latest/userguide/webcrawl-data-source-connector.html) — Um Amazon Bedrock Web Crawler se conecta e rastreia o que você fornece. URLs Os seguintes atributos são compatíveis:
  + Selecione vários URLs para rastrear
  + Respeite as diretivas padrão do robots.txt, como e `Allow` `Disallow`
  + Exclua URLs que correspondam a um padrão
  + Limite a taxa de rastreamento
  + Na Amazon CloudWatch, veja o status de cada URL rastreado

Para obter mais informações sobre as fontes de dados que você pode conectar à sua base de conhecimento Amazon Bedrock, consulte [Criar um conector de fonte de dados para sua base de conhecimento](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html).

## Bancos de dados vetoriais para bases de conhecimento
<a name="rag-fully-managed-bedrock-vector-stores"></a>

Ao configurar uma conexão entre a base de conhecimento e a fonte de dados, você deve configurar um banco de dados vetorial, também conhecido como *armazenamento vetorial*. Um banco de dados vetoriais é onde o Amazon Bedrock armazena, atualiza e gerencia as incorporações que representam seus dados. Cada fonte de dados oferece suporte a diferentes tipos de banco de dados vetoriais. Para determinar quais bancos de dados vetoriais estão disponíveis para sua fonte de dados, consulte os [tipos de fonte de dados](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html).

Se você preferir que o Amazon Bedrock crie automaticamente um banco de dados vetoriais no Amazon OpenSearch Serverless para você, você pode escolher essa opção ao criar a base de conhecimento. No entanto, você também pode optar por configurar seu próprio banco de dados vetoriais. Se você configurar seu próprio banco de dados vetoriais, consulte [Pré-requisitos para seu próprio armazenamento de vetores para obter uma base de conhecimento](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-setup.html). Cada tipo de banco de dados vetorial tem seus próprios pré-requisitos.

Dependendo do tipo de fonte de dados, as bases de conhecimento do Amazon Bedrock oferecem suporte aos seguintes bancos de dados vetoriais:
+ [Amazon sem OpenSearch servidor](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-vector-search.html)
+ [Amazon Aurora Edição Compatível com PostgreSQL](https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/AuroraPostgreSQL.VectorDB.html)
+ [https://docs.pinecone.io/docs/amazon-bedrock](https://docs.pinecone.io/docs/amazon-bedrock) (documentação da Pinecone)
+ [https://docs.redis.com/latest/rc/cloud-integrations/aws-marketplace/aws-bedrock/](https://docs.redis.com/latest/rc/cloud-integrations/aws-marketplace/aws-bedrock/) (documentação da Redis)
+ [https://dochub.mongodb.org/core/amazon-bedrock](https://dochub.mongodb.org/core/amazon-bedrock) (documentação da MongoDB)