

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Perché scegliere Valkey ElastiCache per la memorizzazione nella cache semantica
<a name="semantic-caching-why-elasticache"></a>

I carichi di lavoro di caching semantico scrivono, cercano ed eliminano continuamente le voci della cache per soddisfare il flusso di richieste degli utenti in arrivo, mantenendo le risposte aggiornate. L'archivio cache deve soddisfare i seguenti requisiti:
+ **Real-time aggiornamenti vettoriali**: le nuove query e risposte devono essere immediatamente disponibili nella cache per mantenere i tassi di successo.
+ **Low-latency ricerche**: la cache si trova nel percorso di richiesta online di ogni query, pertanto le ricerche non devono aggiungere ritardi percepibili ai tempi di risposta dell'utente finale.
+ **Gestione efficiente dei dati temporanei: le** voci vengono spesso scritte, lette ed eliminate, il che richiede una gestione efficiente di un hot set.

ElastiCache for Valkey soddisfa questi requisiti:
+ **Ricerca vettoriale con la latenza più bassa** — Al momento in cui scriviamo, ElastiCache per Valkey offre la ricerca vettoriale con la latenza più bassa con il throughput più elevato e il miglior rapporto qualità-prezzo con un tasso di richiamo superiore al 95% tra i database vettoriali più diffusi su. AWS La latenza è di soli microsecondi con un richiamo fino al 99%.
+ Architettura **multithread: Vector search on ElastiCache utilizza un'architettura** multithread che supporta aggiornamenti vettoriali in tempo reale e un throughput di scrittura elevato, pur mantenendo una bassa latenza per le richieste di ricerca.
+ **Built-in funzionalità di cache**: TTL (time to live), policy di sfratto () e operazioni atomiche aiutano a gestire l'effimero `allkeys-lru` hot set di voci creato dalla memorizzazione nella cache semantica.
+ **Supporto per indici vettoriali: ElastiCache supporta gli algoritmi degli indici** HNSW (Hierarchical Navigable Small World) e FLAT con metriche di distanza tra i prodotti COSINE, euclidee e interne.
+ **Zero-downtime scalabilità: ElastiCache supporta la scalabilità senza tempi di inattività**, consentendoti di regolare la capacità man mano che la cache cresce.
+ **Integrazione del framework**: ElastiCache per Valkey si integra con Amazon Bedrock AgentCore tramite il LangGraph framework, consentendoti di implementare una cache Valkey-backed semantica per agenti basata su Amazon Bedrock.