Warum ElastiCache für Valkey für semantisches Caching

Semantische Caching-Workloads schreiben, suchen und löschen kontinuierlich Cache-Einträge, um den Strom eingehender Benutzeranfragen zu bedienen und gleichzeitig die Antworten aktuell zu halten. Der Cache-Speicher muss die folgenden Anforderungen erfüllen:

Real-time Vektor-Updates — Neue Abfragen und Antworten müssen sofort im Cache verfügbar sein, um die Trefferquoten aufrechtzuerhalten.
Low-latency Suchvorgänge — Der Cache befindet sich im Online-Anforderungspfad jeder Anfrage, sodass Suchvorgänge die Antwortzeit des Endbenutzers nicht merklich verzögern dürfen.
Effiziente kurzlebige Verwaltung — Einträge werden häufig geschrieben, gelesen und gelöscht, was eine effiziente Verwaltung eines Hotsets erfordert.

ElastiCache denn Valkey erfüllt diese Anforderungen:

Vektorsuche mit niedrigster Latenz — Zum Zeitpunkt der Erstellung dieses Artikels bietet ElastiCache für Valkey die Vektorsuche mit der niedrigsten Latenz, dem höchsten Durchsatz und dem besten Preis-Leistungs-Verhältnis bei einer Abrufrate von über 95% unter allen gängigen Vektordatenbanken. AWS Die Latenz beträgt nur Mikrosekunden mit einer Erinnerungsrate von bis zu 99%.
Multithread-Architektur — Vector Search on ElastiCache verwendet eine Multithread-Architektur, die Vektoraktualisierungen in Echtzeit und einen hohen Schreibdurchsatz unterstützt und gleichzeitig eine geringe Latenz für Suchanfragen gewährleistet.
Built-in Cache-Funktionen — TTL (Time to Live), Räumungsrichtlinien (allkeys-lru) und atomare Operationen helfen bei der Verwaltung der kurzlebigen Vielzahl von Einträgen, die beim semantischen Caching entstehen.
Unterstützung für Vektorindizes — ElastiCache unterstützt sowohl HNSW- (Hierarchical Navigable Small World) als auch FLAT-Indexalgorithmen mit COSINE-, Euklidischen und Produktdistanzmetriken.
Zero-downtime Skalierbarkeit — ElastiCache unterstützt Skalierung ohne Ausfallzeiten, sodass Sie die Kapazität an den wachsenden Cache anpassen können.
Framework-Integration — ElastiCache für Valkey lässt sich AgentCore über das LangGraph Framework in Amazon Bedrock integrieren, sodass Sie einen Valkey-backed semantischen Cache für Agenten implementieren können, die auf Amazon Bedrock basieren.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Überblick über semantisches Caching

Architektur der Lösung