View a markdown version of this page

Amazon Bedrock 知識庫資料的先決條件 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Bedrock 知識庫資料的先決條件

資料來源包含檔案或內容,其中包含查詢知識庫時可擷取的資訊。您必須將文件或內容存放在至少一個支援的資料來源中。

支援的知識庫資料文件格式和限制

當您連線至支援的資料來源時,內容會擷取至您的知識庫。

如果您使用 Amazon S3 存放檔案或資料來源包含連接檔案,則必須先檢查每個來源文件檔案是否遵循下列各項:

  • 來源檔案採用下列支援的格式:

    格式 延伸
    純文字 (UTF-8 編碼) .txt
    Markdown (UTF-8 編碼) .md
    HyperText 標記語言 (UTF-8 編碼) .html
    Microsoft Word 文件 .doc/.docx
    逗號分隔值 .csv
    Microsoft Excel 試算表 .xls/.xlsx
    可攜文件格式檔 .pdf
  • 每個檔案的大小不超過 50 MB 的配額。

注意

區塊大小配額上限 (以 KB 為單位) 是指文件分割後個別文字區塊的大小,而不是來源文件本身的大小上限。大於區塊大小的文件會自動分割成多個區塊。對於大約 1 KB 的純文字,預期大約 1,000 個字元或 200–250 個英文單字。

如果您使用 Amazon S3 或自訂資料來源,則可以使用多模態資料,包括 JPEG (.jpeg) 或 PNG (.png) 影像,或包含資料表、圖表或其他影像的檔案。

注意

.JPEG 和 .PNG 檔案的大小上限為 3.75 MB。