ソリューションアーキテクチャ

次のアーキテクチャは、Amazon Bedrock AgentCore 上のエージェントのリードスルーセマンティックキャッシュを実装します。リクエストは、次の 2 つのパスのいずれかに従います。

キャッシュヒット – ElastiCache が設定された類似度しきい値を超える以前のクエリを検出した場合、AgentCore はキャッシュされた回答をすぐに返します。このパスは埋め込みモデルのみを呼び出し、LLM 推論を必要としません。このパスにはミリ秒レベルのend-to-endのレイテンシーがあり、LLM 推論コストは発生しません。
キャッシュミス – 同様の以前のクエリが見つからない場合、AgentCore は LLM を呼び出して新しい回答を生成し、ユーザーに返します。次に、アプリケーションはプロンプトの埋め込みと回答を ElastiCache にキャッシュし、将来の同様のプロンプトをキャッシュから提供できるようにします。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

セマンティックキャッシュに ElastiCache for Valkey を使用する理由

前提条件