為什麼 ElastiCache for Valkey 用於語意快取

語意快取工作負載會持續寫入、搜尋和移出快取項目，以提供傳入使用者查詢的串流，同時保持回應新鮮。快取存放區必須符合下列要求：

ElastiCache for Valkey 符合下列要求：

最低延遲向量搜尋 – 在寫入時，ElastiCache for Valkey 在上的熱門向量資料庫之間，以最高的輸送量和 95% 以上的召回率提供最低延遲向量搜尋 AWS。延遲低至微秒，召回率高達 99%。
多執行緒架構 – ElastiCache 上的向量搜尋使用多執行緒架構，可支援即時向量更新和高寫入輸送量，同時維持搜尋請求的低延遲。
內建快取功能 – TTL （存留時間）、移出政策 (allkeys-lru) 和原子操作有助於管理語意快取建立的暫時性項目熱集合。
向量索引支援 – ElastiCache 支援具有 COSINE、Euclidean 和內部產品距離指標的 HNSW (Hierarchical Navigable Small World) 和 FLAT 索引演算法。
零停機時間可擴展性 – ElastiCache 支援擴展而不停機，可讓您隨著快取成長調整容量。
架構整合 – ElastiCache for Valkey 透過 LangGraph 架構與 Amazon Bedrock AgentCore 整合，可讓您為建置在 Amazon Bedrock 上的代理程式實作 Valkey 支援的語意快取。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

語意快取概觀

解決方案架構