¿Por qué Valkey ElastiCache para el almacenamiento en caché semántico?

Las cargas de trabajo de almacenamiento en caché semántico escriben, buscan y expulsan continuamente las entradas de la caché para atender el flujo de consultas entrantes de los usuarios y, al mismo tiempo, mantener las respuestas actualizadas. El almacén de caché debe cumplir los siguientes requisitos:

Real-time actualizaciones vectoriales: las nuevas consultas y respuestas deben estar disponibles inmediatamente en la memoria caché para mantener las tasas de aciertos.
Low-latency búsquedas: la caché se encuentra en la ruta de solicitud en línea de cada consulta, por lo que las búsquedas no deben añadir un retraso perceptible al tiempo de respuesta del usuario final.
Gestión efímera eficiente: las entradas se escriben, leen y desalojan con frecuencia, lo que requiere una gestión eficiente de un conjunto activo.

ElastiCache porque Valkey cumple los siguientes requisitos:

Búsqueda vectorial con la latencia más baja: en el momento de escribir este artículo, ElastiCache Valkey ofrece la búsqueda vectorial de menor latencia con el mayor rendimiento y la mejor relación precio-rendimiento, con una tasa de recuperación superior al 95% entre las bases de datos vectoriales más populares. AWS La latencia es tan baja como microsegundos, con hasta un 99% de recuperación.
Arquitectura multiproceso: la búsqueda vectorial ElastiCache utiliza una arquitectura multiproceso que admite actualizaciones vectoriales en tiempo real y un alto rendimiento de escritura, a la vez que mantiene una baja latencia para las solicitudes de búsqueda.
Built-in funciones de caché: el TTL (tiempo de vida), las políticas de desalojo (allkeys-lru) y las operaciones atómicas ayudan a gestionar el conjunto efímero de entradas activas que crea el almacenamiento semántico en caché.
Compatibilidad con índices vectoriales: ElastiCache es compatible con los algoritmos HNSW (Hierarchical Navigable Small World) y FLAT, con métricas de distancia entre productos internos, euclidianas y cosinas.
Zero-downtime escalabilidad: ElastiCache admite el escalado sin tiempo de inactividad, lo que le permite ajustar la capacidad a medida que crece la memoria caché.
Integración con el marco: ElastiCache para Valkey, se integra con Amazon Bedrock AgentCore a través del LangGraph marco, lo que le permite implementar una caché Valkey-backed semántica para los agentes creada en Amazon Bedrock.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Descripción general del almacenamiento en caché semántico

Arquitectura de soluciones