本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon Bedrock 知识库数据的先决条件
数据来源包含文件或内容,其中的信息可在查询知识库时进行检索。您必须至少在一个支持的数据来源中存储文档或内容。
支持的文档格式以及知识库数据的限制
连接到支持的数据来源后,内容将被摄取到知识库中。
如果您使用 Amazon S3 来存储文件,或者您的数据来源包含附加文件,则必须首先检查每个源文档文件是否符合以下规定:
-
源文件采用以下支持的格式:
Format 扩展程序 纯文本(UTF-8 已编码) .txt Markdown(已UTF-8 编码) .md HyperText 标记语言(已UTF-8 编码) .html Microsoft Word 文档 .doc/.docx Comma-separated 价值观 .csv Microsoft Excel 电子表格 .xls/.xlsx 可移植文档格式 .pdf -
每个文件的大小不超出 50 MB 的配额。
注意
最大区块大小配额(以 KB 为单位)是指按分块策略拆分文档后单个文本块的大小,而不是源文档本身的最大大小。大于区块大小的文档会自动拆分为多个块。对于大约 1 KB 的纯文本,预计大约 1,000 个字符或 200—250 个英语单词。
如果您使用 Amazon S3 或自定义数据来源,则可以使用多模态数据,包括 JPEG(.jpeg)或 PNG(.png)图像,或包含表格、图表、示意图或其他图像的文件。
注意
.JPEG 和 .PNG 文件的最大大小为 3.75 MB。