View a markdown version of this page

Conditions préalables pour les données de votre base de connaissances Amazon Bedrock - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Conditions préalables pour les données de votre base de connaissances Amazon Bedrock

Une source de données contient des fichiers ou du contenu avec des informations qui peuvent être récupérées lorsque votre base de connaissances est interrogée. Vous devez stocker vos documents ou votre contenu dans au moins l’une des sources de données prises en charge.

Formats de documents pris en charge et limites pour les données de base de connaissances

Lorsque vous vous connectez à une source de données prise en charge, le contenu est ingéré dans votre base de connaissances.

Si vous stockez vos fichiers à l’aide d’Amazon S3 ou si votre source de données inclut des fichiers joints, vous devez d’abord vérifier que chaque fichier de document source remplit les conditions suivantes :

  • Les fichiers source sont dans l’un des formats pris en charge suivants :

    Format Extension
    Texte brut (UTF-8 codé) .txt
    Markdown (UTF-8 encodé) .md
    HyperText Langage de balisage (UTF-8 encodé) .html
    Document Microsoft Word .doc/.docx
    Comma-separated valeurs .csv
    Feuille de calcul Microsoft Excel .xls/.xlsx
    PDF (Portable Document Format) .pdf
  • La taille de chaque fichier ne dépasse pas le quota de 50 Mo.

Note

Le quota de taille de bloc maximal (mesuré en Ko) fait référence à la taille des blocs de texte individuels une fois que vos documents ont été divisés par la stratégie de découpage, et non à la taille maximale du document source lui-même. Les documents dont la taille est supérieure à la taille du bloc sont automatiquement divisés en plusieurs parties. Pour environ 1 Ko de texte brut, comptez environ 1 000 caractères ou 200 à 250 mots anglais.

Si vous utilisez une source de données Amazon S3 ou personnalisée, vous pouvez utiliser des données multimodales, notamment des images JPEG (.jpeg) ou PNG (.png) ou des fichiers contenant des tableaux, des graphiques, des diagrammes ou d’autres images.

Note

La taille maximale des fichiers .JPEG et .PNG est de 3,75 Mo.