Amazon ElastiCache for Valkey を使用したセマンティックキャッシュ

大規模言語モデル (LLMs) は、チャットボットや検索アシスタントからコード生成ツールやレコメンデーションエンジンまで、ユースケースを強化する生成 AI およびエージェント AI アプリケーションの基盤です。本番環境での AI アプリケーションの使用が増えるにつれて、お客様はコストとパフォーマンスを最適化する方法を探します。ほとんどの AI アプリケーションは、クエリが繰り返されたり意味的に類似している場合でも、ユーザークエリごとに LLM を呼び出します。セマンティックキャッシュは、ベクトル埋め込みを使用して同一または意味的に類似したリクエストにレスポンスを再利用することで、生成 AI アプリケーションのコストとレイテンシーを削減する方法です。

このトピックでは、概念、アーキテクチャ、実装、ベンチマーク、ベストプラクティスなど、Amazon ElastiCache for Valkey でベクトル検索を使用してセマンティックキャッシュを実装する方法について説明します。

注記

AI エージェントでセマンティックキャッシュを構築するには、 ElastiCache のエージェントツールページにアクセスして ElastiCache スキルと Valkey MCP サーバーをインストールします。セマンティックキャッシュワークフローを設定するための知識と自動埋め込み生成、類似度検索を提供します。

トピック

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ユースケース

セマンティックキャッシュの概要