Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Prasyarat untuk data basis pengetahuan Amazon Bedrock Anda
Sumber data berisi file atau konten dengan informasi yang dapat diambil ketika basis pengetahuan Anda ditanyakan. Anda harus menyimpan dokumen atau konten Anda setidaknya di salah satu sumber data yang didukung.
Format dan batasan dokumen yang didukung untuk data basis pengetahuan
Saat Anda terhubung ke sumber data yang didukung, konten akan dimasukkan ke dalam basis pengetahuan Anda.
Jika Anda menggunakan Amazon S3 untuk menyimpan file Anda atau sumber data Anda menyertakan file terlampir, maka Anda harus terlebih dahulu memeriksa apakah setiap file dokumen sumber mematuhi hal-hal berikut:
-
File sumber adalah dari format yang didukung berikut:
Format Ekstensi Teks biasa (UTF-8 dikodekan) .txt Markdown (UTF-8 dikodekan) .md HyperText Bahasa Markup (UTF-8 dikodekan) .html Dokumen Microsoft Word .doc/.docx Comma-separated nilai .csv Spreadsheet Microsoft Excel .xls/.xlsx Format Dokumen Portabel .pdf -
Setiap ukuran file tidak melebihi kuota 50 MB.
catatan
Kuota ukuran potongan maksimum (diukur dalam KB) mengacu pada ukuran potongan teks individual setelah dokumen Anda dibagi oleh strategi chunking — bukan ukuran maksimum dokumen sumber itu sendiri. Dokumen yang lebih besar dari ukuran potongan secara otomatis dibagi menjadi beberapa bagian. Untuk sekitar 1 KB teks biasa, harapkan sekitar 1.000 karakter atau 200-250 kata bahasa Inggris.
Jika Anda menggunakan Amazon S3 atau sumber data kustom, Anda dapat menggunakan data multimodal, termasuk gambar JPEG (.jpeg) atau PNG (.png) atau file yang berisi tabel, bagan, diagram, atau gambar lainnya.
catatan
Ukuran maksimum file.JPEG dan .PNG adalah 3,75 MB.