As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Por que ElastiCache usar o Valkey para armazenamento em cache semântico
As cargas de trabalho de cache semântico gravam, pesquisam e despejam continuamente entradas de cache para atender ao fluxo de consultas recebidas do usuário e, ao mesmo tempo, manter as respostas atualizadas. O armazenamento em cache deve atender aos seguintes requisitos:
Real-time atualizações vetoriais — novas consultas e respostas devem estar imediatamente disponíveis no cache para manter as taxas de acerto.
Low-latency pesquisas — o cache fica no caminho da solicitação on-line de cada consulta, portanto, as pesquisas não devem adicionar atrasos perceptíveis ao tempo de resposta do usuário final.
Gerenciamento efêmero eficiente — as entradas são frequentemente gravadas, lidas e removidas, exigindo o gerenciamento eficiente de um hot set.
ElastiCache para Valkey atende aos seguintes requisitos:
Pesquisa vetorial de menor latência — No momento em que este artigo foi escrito, o ElastiCache for Valkey oferece a pesquisa vetorial de menor latência com a maior taxa de transferência e o melhor custo-benefício com uma taxa de recuperação de mais de 95% entre os bancos de dados vetoriais populares em. AWS A latência é tão baixa quanto microssegundos com até 99% de recuperação.
Arquitetura multisegmentada — a pesquisa vetorial ativa ElastiCache usa uma arquitetura multisegmentada que oferece suporte a atualizações vetoriais em tempo real e alta taxa de gravação, mantendo baixa latência para solicitações de pesquisa.
Built-in recursos de cache — TTL (time to live), políticas de despejo (
allkeys-lru) e operações atômicas ajudam a gerenciar o conjunto efêmero de entradas que o cache semântico cria.Suporte a índices vetoriais — ElastiCache suporta algoritmos de índice HNSW (Hierarchical Navigable Small World) e FLAT com métricas de distância COSINE, euclidiana e interna do produto.
Zero-downtime escalabilidade — ElastiCache suporta escalabilidade sem tempo de inatividade, permitindo que você ajuste a capacidade à medida que seu cache cresce.
Integração da estrutura — ElastiCache o Valkey se integra ao Amazon Bedrock AgentCore por meio da LangGraph estrutura, permitindo que você implemente um cache Valkey-backed semântico para agentes criados no Amazon Bedrock.