Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Warum ElastiCache für Valkey für semantisches Caching
Semantische Caching-Workloads schreiben, suchen und löschen kontinuierlich Cache-Einträge, um den Strom eingehender Benutzeranfragen zu bedienen und gleichzeitig die Antworten aktuell zu halten. Der Cache-Speicher muss die folgenden Anforderungen erfüllen:
Real-time Vektor-Updates — Neue Abfragen und Antworten müssen sofort im Cache verfügbar sein, um die Trefferquoten aufrechtzuerhalten.
Low-latency Suchvorgänge — Der Cache befindet sich im Online-Anforderungspfad jeder Anfrage, sodass Suchvorgänge die Antwortzeit des Endbenutzers nicht merklich verzögern dürfen.
Effiziente kurzlebige Verwaltung — Einträge werden häufig geschrieben, gelesen und gelöscht, was eine effiziente Verwaltung eines Hotsets erfordert.
ElastiCache denn Valkey erfüllt diese Anforderungen:
Vektorsuche mit niedrigster Latenz — Zum Zeitpunkt der Erstellung dieses Artikels bietet ElastiCache für Valkey die Vektorsuche mit der niedrigsten Latenz, dem höchsten Durchsatz und dem besten Preis-Leistungs-Verhältnis bei einer Abrufrate von über 95% unter allen gängigen Vektordatenbanken. AWS Die Latenz beträgt nur Mikrosekunden mit einer Erinnerungsrate von bis zu 99%.
Multithread-Architektur — Vector Search on ElastiCache verwendet eine Multithread-Architektur, die Vektoraktualisierungen in Echtzeit und einen hohen Schreibdurchsatz unterstützt und gleichzeitig eine geringe Latenz für Suchanfragen gewährleistet.
Built-in Cache-Funktionen — TTL (Time to Live), Räumungsrichtlinien (
allkeys-lru) und atomare Operationen helfen bei der Verwaltung der kurzlebigen Vielzahl von Einträgen, die beim semantischen Caching entstehen.Unterstützung für Vektorindizes — ElastiCache unterstützt sowohl HNSW- (Hierarchical Navigable Small World) als auch FLAT-Indexalgorithmen mit COSINE-, Euklidischen und Produktdistanzmetriken.
Zero-downtime Skalierbarkeit — ElastiCache unterstützt Skalierung ohne Ausfallzeiten, sodass Sie die Kapazität an den wachsenden Cache anpassen können.
Framework-Integration — ElastiCache für Valkey lässt sich AgentCore über das LangGraph Framework in Amazon Bedrock integrieren, sodass Sie einen Valkey-backed semantischen Cache für Agenten implementieren können, die auf Amazon Bedrock basieren.