View a markdown version of this page

Tipos de memória agêntica - Amazon ElastiCache

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Tipos de memória agêntica

Short-term memória

Short-term a memória mantém o contexto em uma única sessão. Ele rastreia o fluxo atual da conversa, as interações recentes e as etapas intermediárias de raciocínio. Short-term a memória é essencial para conversas em vários turnos em que o agente precisa referenciar partes anteriores do diálogo.

ElastiCache for Valkey suporta memória de curto prazo por meio de estruturas de dados, como listas (para histórico de bate-papo ordenado), hashes (para metadados de sessão) e strings (para armazenamento em cache de resultados de ferramentas com expiração). TTL-based

Long-term memória

Long-term a memória armazena informações em várias sessões. Isso permite que os agentes se lembrem das preferências do usuário, das decisões passadas e do contexto histórico para futuras conversas. Long-terma memória requer um armazenamento persistente e pesquisável que ofereça suporte à recuperação semântica — encontrando memórias relevantes com base no significado, e não em correspondências exatas de palavras-chave.

ElastiCache for Valkey suporta memória de longo prazo por meio de seus recursos de pesquisa de similaridade vetorial (disponíveis no Valkey 8.2 e versões posteriores). A pesquisa vetorial permite a recuperação semântica da memória, permitindo que os agentes encontrem memórias relevantes com base no significado, comparando incorporações vetoriais de memórias armazenadas com novas consultas.

Tipos de memória adicionais

Tipo de memória Description ElastiCache apoio
Memória episódica Registros de interações e eventos específicos do passado Pesquisa vetorial sobre incorporações de conversas armazenadas
Memória semântica Conhecimento geral e fatos extraídos das interações Pesquisa de similaridade vetorial com índices HNSW ou FLAT
Memória processual Conhecimento sobre como realizar tarefas e usar ferramentas Hash-based armazenamento de configurações de ferramentas e fluxos de trabalho