View a markdown version of this page

Amazon Bedrock ナレッジベースデータの前提条件 - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Bedrock ナレッジベースデータの前提条件

データソースには、ナレッジベースをクエリする際に取得できる情報を含むファイルまたはコンテンツが含まれます。ドキュメントまたはコンテンツは、サポートされているデータソース の 1 つ以上に保存する必要があります。

ナレッジベースデータにサポートされているドキュメント形式と制限

サポートされているデータソースに接続すると、コンテンツはナレッジベースに取り込まれます。

Amazon S3 を使用してファイルを保存する場合、またはデータソースにアタッチされたファイルが含まれている場合は、まず各ソースドキュメントファイルが次の内容に準拠していることを確認する必要があります。

  • ソースファイルは、次のサポートされている形式です。

    形式 拡張機能
    プレーンテキスト (UTF-8 エンコード) .txt
    マークダウン (UTF-8 エンコード) .md
    HyperText マークアップ言語 (UTF-8 エンコード) .html
    Microsoft Word ドキュメント .doc/.docx
    カンマ区切り値 .csv
    Microsoft Excel スプレッドシート .xls/.xlsx
    Portable Document Format .pdf
  • 各ファイルサイズは 50 MB のクォータを超えないようにしてください。

注記

最大チャンクサイズクォータ (KB で測定) は、ドキュメントがチャンキング戦略で分割された後の個々のテキストチャンクのサイズを指します。ソースドキュメント自体の最大サイズではありません。チャンクサイズより大きいドキュメントは、自動的に複数のチャンクに分割されます。約 1 KB のプレーンテキストの場合、約 1,000 文字または 200~250 英語の単語を想定します。

Amazon S3 またはカスタムデータソースを使用する場合は、JPEG (.jpeg) または PNG (.png) イメージ、あるいは表、グラフ、図、その他のイメージを含むファイルなどのマルチモーダルデータを使用できます。

注記

.JPEG ファイルと .PNG ファイルの最大サイズは、3.75 MB です。