Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Requisitos previos para los datos de la base de conocimientos de Amazon Bedrock
Un origen de datos contiene archivos o contenido con información que se puede recuperar cuando se consulta la base de conocimiento. Debe almacenar los documentos o el contenido en al menos uno de los orígenes de datos admitidos.
Formatos de documento compatibles y límites para los datos de la base de conocimientos
Cuando se conecta a un origen de datos admitido, el contenido se incorpora a la base de conocimientos.
Si utiliza Amazon S3 para almacenar sus archivos o si su origen de datos incluye archivos adjuntos, primero debe comprobar que cada archivo del documento de origen cumpla con lo siguiente:
-
Los archivos de origen tienen los siguientes formatos compatibles:
Formato Extensión Texto plano (UTF-8 codificado) .txt Markdown (UTF-8 codificado) .md HyperText Lenguaje de marcado (codificado) UTF-8 .html Documento de Microsoft Word .doc/.docx Comma-separated valores .csv Hoja de cálculo de Microsoft Excel .xls/.xlsx Formato de documento portátil .pdf -
El tamaño de cada archivo no supera la cuota de 50 MB.
nota
La cuota máxima de tamaño de fragmentos (medida en KB) se refiere al tamaño de los fragmentos de texto individuales después de dividir los documentos según la estrategia de fragmentación, no al tamaño máximo del propio documento de origen. Los documentos con un tamaño superior al de un fragmento se dividen automáticamente en varios fragmentos. Para aproximadamente 1 KB de texto sin formato, se esperan aproximadamente 1000 caracteres o entre 200 y 250 palabras en inglés.
Si utiliza Amazon S3 o un origen de datos personalizado, puede utilizar datos multimodales, incluidas imágenes JPEG (.jpeg) o PNG (.png) o archivos que contengan tablas, gráficos, diagramas u otras imágenes.
nota
El tamaño máximo de los archivos .JPEG y .PNG es de 3,75 MB.