セマンティックキャッシュに ElastiCache for Valkey を使用する理由

セマンティックキャッシュワークロードは、キャッシュエントリを継続的に書き込み、検索、削除して、受信ユーザークエリのストリームを提供しながら、レスポンスを最新の状態に保ちます。キャッシュストアは、次の要件を満たしている必要があります。

リアルタイムベクトル更新 – ヒット率を維持するために、新しいクエリとレスポンスをキャッシュですぐに利用できる必要があります。
低レイテンシールックアップ – キャッシュはすべてのクエリのオンラインリクエストパスにあるため、エンドユーザーの応答時間に認識できる遅延を追加してはいけません。
効率的なエフェメラル管理 – エントリは頻繁に書き込み、読み取り、削除されるため、ホットセットを効率的に管理する必要があります。

ElastiCache for Valkey は、次の要件を満たしています。

最低レイテンシーのベクトル検索 – 書き込み時に、ElastiCache for Valkey は、の一般的なベクトルデータベースの中でスループットと最高の価格パフォーマンスが 95% 以上の再現率で、最低レイテンシーのベクトル検索を提供します AWS。レイテンシーはマイクロ秒と低く、再現率は最大 99% です。
マルチスレッドアーキテクチャ – ElastiCache でのベクトル検索は、検索リクエストの低レイテンシーを維持しながら、リアルタイムのベクトル更新と高い書き込みスループットをサポートするマルチスレッドアーキテクチャを使用します。
組み込みキャッシュ機能 – TTL (有効期限）、エビクションポリシー (allkeys-lru)、アトミックオペレーションは、セマンティックキャッシュが作成するエントリの一時的なホットセットを管理するのに役立ちます。
ベクトルインデックスのサポート – ElastiCache は、COSINE、ユークリッド、および内部製品距離メトリクスを使用して、HNSW (Hierarchical Navigable Small World) と FLAT インデックスアルゴリズムの両方をサポートしています。
ダウンタイムのないスケーラビリティ – ElastiCache はダウンタイムのないスケーリングをサポートしているため、キャッシュの増加に合わせて容量を調整できます。
フレームワーク統合 – ElastiCache for Valkey は LangGraph フレームワークを介して Amazon Bedrock AgentCore と統合されるため、Amazon Bedrock 上に構築されたエージェントの Valkey-backed セマンティックキャッシュを実装できます。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

セマンティックキャッシュの概要

ソリューションアーキテクチャ