Arquitetura Description Capacidades Limitações Casos de uso comuns Orientação para implementação Resumo Arquitetura Description Capacidades Casos de uso comuns Orientação para implementação Resumo

Agentes básicos de raciocínio

Um agente de raciocínio básico é a forma mais simples de IA agente que realiza inferência lógica ou tomada de decisão em resposta a uma consulta. Ele aceita a entrada de um usuário ou sistema e processa consultas e gera respostas usando prompts estruturados.

Esse padrão é útil para tarefas que exigem raciocínio, classificação ou resumo em uma única etapa com base em um determinado contexto. Ele não usa memória, ferramentas ou gerenciamento de estado, o que o torna sem estado, leve e altamente combinável em grandes fluxos de trabalho.

Arquitetura

O fluxo de um agente de raciocínio básico é mostrado no diagrama a seguir:

Description

Recebe uma entrada
- Um usuário, sistema ou agente upstream envia uma consulta ou instrução.
- A entrada é transferida para o shell do agente ou para a camada de orquestração.
- Essa etapa inclui qualquer pré-processamento, modelagem imediata e identificação de metas.
Invoca o LLM
- O agente transforma a consulta em um prompt estruturado e a envia para um LLM (por exemplo, por meio do Amazon Bedrock).
- O LLM gera uma resposta com base no prompt usando conhecimento e contexto pré-treinados.
- A saída gerada pode incluir etapas de raciocínio (cadeia de pensamento), respostas finais ou opções classificadas.
Retorna uma resposta
- A saída gerada é retransmitida para a interface do agente.
- Isso pode incluir formatação, pós-processamento ou uma resposta de API.

Capacidades

Suporta linguagem natural ou entrada estruturada
Usa engenharia rápida para orientar o comportamento
Sem estado e escalável
Pode ser incorporado à interface do usuário, CLI, APIs e pipelines

Limitações

Sem memória ou consciência histórica
Sem interação com ferramentas externas ou fontes de dados
Limitado ao que o LLM sabe no momento da inferência

Casos de uso comuns

Perguntas e respostas conversacionais
Explicações e resumos de políticas
Orientação para a tomada de decisões
Fluxos de chatbot leves e automatizados
Classificação, rotulagem e pontuação

Orientação para implementação

Você pode usar as seguintes ferramentas e serviços para criar um agente de raciocínio básico:

Amazon Bedrock para invocação de LLM (Anthropic, AI21, Meta)
Amazon API Gateway ou AWS Lambda para expô-lo como um microsserviço sem estado
Modelos de prompt armazenados no Parameter Store ou como código AWS Secrets Manager

Resumo

O agente de raciocínio básico é fundamental por causa de sua estrutura simples. Ele tem recursos essenciais que transformam metas em caminhos de raciocínio que levam a resultados inteligentes. Esse padrão geralmente é um ponto de partida para padrões avançados, como agentes baseados em ferramentas e agentes que usam geração aumentada de recuperação (RAG). Também é um componente confiável e modular de grandes fluxos de trabalho.

Agente RAG

Retrieval-augmented a geração (RAG) é uma técnica que combina recuperação de informações com geração de texto para criar respostas precisas e contextuais. O RAG permite que os agentes recuperem informações externas relevantes antes de contratar o LLM. Ele amplia a memória efetiva e a precisão do raciocínio de um agente ao basear suas decisões em informações atualizadas, factuais ou específicas do domínio. Em contraste com os LLMs sem estado que dependem exclusivamente de pesos pré-treinados, o RAG tem uma camada externa de pesquisa de conhecimento que aprimora dinamicamente as solicitações com o contexto.

Arquitetura

A lógica do padrão RAG é ilustrada no diagrama a seguir:

Description

Recebe uma consulta
- Um usuário ou sistema upstream envia uma consulta ou meta ao agente.
- O shell do agente aceita a solicitação e a formata como uma solicitação de raciocínio.
Pesquisa uma fonte externa
- O agente identifica os conceitos e a intenção da consulta.
- Ele consulta uma fonte de conhecimento, como um repositório vetorial, banco de dados ou índice de documentos usando pesquisa semântica ou correspondência de palavras-chave.
- As passagens, documentos ou entidades mais relevantes são recuperados para uso na próxima etapa.
Gera uma resposta contextual
- O agente aumenta o prompt com as informações recuperadas, formando uma entrada contextualizada para o LLM.
- O LLM processa qualquer entrada usando raciocínio generativo (por exemplo, cadeia de pensamento ou reflexão) para produzir uma resposta precisa.
Retorna a saída final
- O agente prepara a saída envolvendo-a em qualquer cabeçalho de comunicação ou na formatação necessária e, em seguida, a retorna ao usuário ou ao sistema de chamada.
- (Opcional) Os documentos recuperados e a saída do LLM podem ser registrados, pontuados e armazenados na memória para futuras consultas.

Capacidades

Fact-grounded produção mesmo em domínios de longa duração ou específicos da empresa
Extensão de memória sem ajustar o modelo
Contexto dinâmico baseado em cada consulta e estado do usuário
Totalmente compatível com bancos de dados vetoriais, índices semânticos e filtragem de metadados

Casos de uso comuns

Assistentes de conhecimento corporativo
Bots de conformidade regulatória
Co-pilotos de suporte ao cliente
Search-enhanced chatbots
Agentes de documentação para desenvolvedores

Orientação para implementação

Use as seguintes ferramentas e serviços para criar um agente que usa o RAG:

Amazon Bedrock para invocação de LLM
Amazon Kendra OpenSearch ou Amazon Aurora para documentação ou pesquisa estruturada de dados
Amazon Simple Storage Service (Amazon S3) (Amazon S3) para armazenamento de documentos
AWS Lambda para orquestrar a pesquisa, o prompt e a inferência do LLM
Knowledge-based integrações com agentes (usando plug-ins de memória, recuperadores semânticos ou Amazon Bedrock)

Resumo

O agente RAG conecta o raciocínio do modelo estático à inteligência dinâmica do mundo real. Ele capacita os agentes com a capacidade de pesquisar o que não sabem, sintetizar respostas a partir do conhecimento recuperado e produzir respostas auditáveis e de alta confiança.

Os padrões RAG são a base para a criação de agentes inteligentes que escalam o acesso ao conhecimento sem reciclagem. Geralmente, é um precursor de padrões de orquestração mais complexos que envolvem o uso de ferramentas, planejamento e memória de longo prazo.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Padrões de agentes

Tool-based agentes para chamar funções