Pourquoi choisir Valkey ElastiCache pour la mise en cache sémantique

Les charges de travail de mise en cache sémantique écrivent, recherchent et éliminent en permanence des entrées de cache pour répondre au flux de requêtes des utilisateurs entrantes tout en actualisant les réponses. Le magasin de cache doit répondre aux exigences suivantes :

Real-time mises à jour vectorielles : les nouvelles requêtes et réponses doivent être immédiatement disponibles dans le cache pour maintenir les taux de réussite.
Low-latency recherches — Le cache se trouve dans le chemin de requête en ligne de chaque requête. Les recherches ne doivent donc pas retarder de manière perceptible le temps de réponse de l'utilisateur final.
Gestion éphémère efficace — Les inscriptions sont fréquemment écrites, lues et supprimées, ce qui nécessite une gestion efficace d'un hot set.

ElastiCache car Valkey répond à ces exigences :

Recherche vectorielle à latence la plus faible — Au moment de la rédaction de cet article, ElastiCache for Valkey propose la recherche vectorielle la plus faible latence avec le débit le plus élevé et le meilleur rapport qualité-prix avec un taux de rappel de plus de 95 % parmi les bases de données vectorielles populaires sur. AWS La latence est aussi faible que quelques microsecondes avec jusqu'à 99 % de rappel.
Architecture multithread — La recherche vectorielle ElastiCache utilise une architecture multithread qui prend en charge les mises à jour vectorielles en temps réel et un débit d'écriture élevé tout en maintenant une faible latence pour les requêtes de recherche.
Built-in fonctionnalités de cache : le TTL (time to live), les politiques d'expulsion (allkeys-lru) et les opérations atomiques aident à gérer le lot d'entrées éphémères créé par la mise en cache sémantique.
Support d'index vectoriel : ElastiCache prend en charge les algorithmes HNSW (Hierarchical Navigable Small World) et FLAT avec des métriques de distance COSINE, euclidienne et interne au produit.
Zero-downtime évolutivité : ElastiCache prend en charge la mise à l'échelle sans interruption de service, ce qui vous permet d'ajuster la capacité à mesure que votre cache augmente.
Intégration au framework : car ElastiCache Valkey s'intègre à Amazon Bedrock AgentCore via le LangGraph framework, ce qui vous permet d'implémenter un cache Valkey-backed sémantique pour les agents créés sur Amazon Bedrock.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Présentation de la mise en cache sémantique

Architecture de la solution