本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
為什麼 ElastiCache for Valkey 用於語意快取
語意快取工作負載會持續寫入、搜尋和移出快取項目,以提供傳入使用者查詢的串流,同時保持回應新鮮。快取存放區必須符合下列要求:
即時向量更新 – 快取中必須立即提供新的查詢和回應,以維持命中率。
低延遲查詢 – 快取位於每個查詢的線上請求路徑中,因此查詢不得為最終使用者回應時間新增明顯的延遲。
高效暫時性管理 – 經常寫入、讀取和移出項目,需要高效管理熱集。
ElastiCache for Valkey 符合下列要求:
最低延遲向量搜尋 – 在寫入時,ElastiCache for Valkey 在 上的熱門向量資料庫之間,以最高的輸送量和 95% 以上的召回率提供最低延遲向量搜尋 AWS。延遲低至微秒,召回率高達 99%。
多執行緒架構 – ElastiCache 上的向量搜尋使用多執行緒架構,可支援即時向量更新和高寫入輸送量,同時維持搜尋請求的低延遲。
內建快取功能 – TTL (存留時間)、移出政策 (
allkeys-lru) 和原子操作有助於管理語意快取建立的暫時性項目熱集合。向量索引支援 – ElastiCache 支援具有 COSINE、Euclidean 和內部產品距離指標的 HNSW (Hierarchical Navigable Small World) 和 FLAT 索引演算法。
零停機時間可擴展性 – ElastiCache 支援擴展而不停機,可讓您隨著快取成長調整容量。
架構整合 – ElastiCache for Valkey 透過 LangGraph 架構與 Amazon Bedrock AgentCore 整合,可讓您為建置在 Amazon Bedrock 上的代理程式實作 Valkey 支援的語意快取。