Por que ElastiCache usar o Valkey para armazenamento em cache semântico

As cargas de trabalho de cache semântico gravam, pesquisam e despejam continuamente entradas de cache para atender ao fluxo de consultas recebidas do usuário e, ao mesmo tempo, manter as respostas atualizadas. O armazenamento em cache deve atender aos seguintes requisitos:

Real-time atualizações vetoriais — novas consultas e respostas devem estar imediatamente disponíveis no cache para manter as taxas de acerto.
Low-latency pesquisas — o cache fica no caminho da solicitação on-line de cada consulta, portanto, as pesquisas não devem adicionar atrasos perceptíveis ao tempo de resposta do usuário final.
Gerenciamento efêmero eficiente — as entradas são frequentemente gravadas, lidas e removidas, exigindo o gerenciamento eficiente de um hot set.

ElastiCache para Valkey atende aos seguintes requisitos:

Pesquisa vetorial de menor latência — No momento em que este artigo foi escrito, o ElastiCache for Valkey oferece a pesquisa vetorial de menor latência com a maior taxa de transferência e o melhor custo-benefício com uma taxa de recuperação de mais de 95% entre os bancos de dados vetoriais populares em. AWS A latência é tão baixa quanto microssegundos com até 99% de recuperação.
Arquitetura multisegmentada — a pesquisa vetorial ativa ElastiCache usa uma arquitetura multisegmentada que oferece suporte a atualizações vetoriais em tempo real e alta taxa de gravação, mantendo baixa latência para solicitações de pesquisa.
Built-in recursos de cache — TTL (time to live), políticas de despejo (allkeys-lru) e operações atômicas ajudam a gerenciar o conjunto efêmero de entradas que o cache semântico cria.
Suporte a índices vetoriais — ElastiCache suporta algoritmos de índice HNSW (Hierarchical Navigable Small World) e FLAT com métricas de distância COSINE, euclidiana e interna do produto.
Zero-downtime escalabilidade — ElastiCache suporta escalabilidade sem tempo de inatividade, permitindo que você ajuste a capacidade à medida que seu cache cresce.
Integração da estrutura — ElastiCache o Valkey se integra ao Amazon Bedrock AgentCore por meio da LangGraph estrutura, permitindo que você implemente um cache Valkey-backed semântico para agentes criados no Amazon Bedrock.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Visão geral do cache semântico

Arquitetura da solução