

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# ElastiCache Por que usar o Valkey para memória magnética
<a name="agentic-memory-why-elasticache"></a>

ElastiCache for Valkey fornece vários recursos que o tornam adequado como camada de armazenamento para memória agente:
+ **Sub-millisecond latência** — o Valkey oferece latência em nível de microssegundos ElastiCache para operações de memória, tornando-o adequado para interações de agentes em tempo real, nas quais as pesquisas de memória não devem adicionar atrasos perceptíveis à experiência do usuário.
+ **Pesquisa por similaridade vetorial** — A partir da versão 8.2 do Valkey, ElastiCache oferece suporte à pesquisa por similaridade vetorial por meio do módulo valkey-search. Isso permite a recuperação semântica da memória, onde os agentes podem encontrar memórias relevantes com base no significado, em vez de correspondências exatas de palavras-chave.
+ **Real-time atualizações do índice** — Novas memórias se tornam imediatamente pesquisáveis após serem gravadas. Isso é fundamental para aplicativos agentes em que o agente pode precisar recuperar as informações armazenadas há momentos na mesma sessão.
+ **Built-in gerenciamento de cache** — recursos como TTL (time to live), políticas de despejo (`allkeys-lru`) e operações atômicas ajudam a gerenciar o ciclo de vida da memória.
+ **Várias estruturas de dados** — o Valkey fornece hashes, listas, cadeias de caracteres, fluxos, JSON e vetores — cada uma otimizada para diferentes padrões de memória. Uma única ElastiCache instância pode oferecer suporte ao estado da sessão (hashes), ao histórico de conversas (listas), ao armazenamento em cache dos resultados da ferramenta (cadeias de caracteres com TTL), aos registros de eventos (fluxos) e à memória semântica (vetores).
+ **Escalabilidade** — ElastiCache escalável para lidar com milhões de solicitações com baixa latência consistente, oferecendo suporte a aplicativos com um grande número de usuários e agentes simultâneos.