View a markdown version of this page

Amazon Bedrock 知识库数据的先决条件 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Bedrock 知识库数据的先决条件

数据来源包含文件或内容,其中的信息可在查询知识库时进行检索。您必须至少在一个支持的数据来源中存储文档或内容。

支持的文档格式以及知识库数据的限制

连接到支持的数据来源后,内容将被摄取到知识库中。

如果您使用 Amazon S3 来存储文件,或者您的数据来源包含附加文件,则必须首先检查每个源文档文件是否符合以下规定:

  • 源文件采用以下支持的格式:

    Format 扩展程序
    纯文本(UTF-8 已编码) .txt
    Markdown(已UTF-8 编码) .md
    HyperText 标记语言(已UTF-8 编码) .html
    Microsoft Word 文档 .doc/.docx
    Comma-separated 价值观 .csv
    Microsoft Excel 电子表格 .xls/.xlsx
    可移植文档格式 .pdf
  • 每个文件的大小不超出 50 MB 的配额。

注意

最大区块大小配额(以 KB 为单位)是指按分块策略拆分文档后单个文本块的大小,而不是源文档本身的最大大小。大于区块大小的文档会自动拆分为多个块。对于大约 1 KB 的纯文本,预计大约 1,000 个字符或 200—250 个英语单词。

如果您使用 Amazon S3 或自定义数据来源,则可以使用多模态数据,包括 JPEG(.jpeg)或 PNG(.png)图像,或包含表格、图表、示意图或其他图像的文件。

注意

.JPEG 和 .PNG 文件的最大大小为 3.75 MB。