

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Amazon Bedrock 知识库数据的先决条件
<a name="knowledge-base-ds"></a>

数据来源包含文件或内容，其中的信息可在查询知识库时进行检索。您必须至少在一个[支持的数据来源](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html)中存储文档或内容。

## 支持的文档格式以及知识库数据的限制
<a name="kb-ds-supported-doc-formats-limits"></a>

连接到[支持的数据来源](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html)后，内容将被摄取到知识库中。

如果您使用 Amazon S3 来存储文件，或者您的数据来源包含附加文件，则必须首先检查每个源文档文件是否符合以下规定：
+ 源文件采用以下支持的格式：  
****    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/knowledge-base-ds.html)
+ 每个文件的大小不超出 50 MB 的配额。

**注意**  
最大区块大小配额（以 KB 为单位）是指按分块策略拆分文档后单个文本块的大小，而不是源文档本身的最大大小。大于区块大小的文档会自动拆分为多个块。对于大约 1 KB 的纯文本，预计大约 1,000 个字符或 200—250 个英语单词。

如果您使用 Amazon S3 或自定义数据来源，则可以使用多模态数据，包括 JPEG（.jpeg）或 PNG（.png）图像，或包含表格、图表、示意图或其他图像的文件。

**注意**  
.JPEG 和 .PNG 文件的最大大小为 3.75 MB。