翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon ElastiCache for Valkey を使用したセマンティックキャッシュ
大規模言語モデル (LLMs) は、チャットボットや検索アシスタントからコード生成ツールやレコメンデーションエンジンまで、ユースケースを強化する生成 AI およびエージェント AI アプリケーションの基盤です。本番環境での AI アプリケーションの使用が増えるにつれて、お客様はコストとパフォーマンスを最適化する方法を探します。ほとんどの AI アプリケーションは、クエリが繰り返されたり意味的に類似している場合でも、ユーザークエリごとに LLM を呼び出します。セマンティックキャッシュは、ベクトル埋め込みを使用して同一または意味的に類似したリクエストにレスポンスを再利用することで、生成 AI アプリケーションのコストとレイテンシーを削減する方法です。
このトピックでは、概念、アーキテクチャ、実装、ベンチマーク、ベストプラクティスなど、Amazon ElastiCache for Valkey でベクトル検索を使用してセマンティックキャッシュを実装する方法について説明します。