

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 理解文件
<a name="modalities-document"></a>

**注意**  
本文件適用於 Amazon Nova 第 1 版。如需 Amazon Nova 2 文件理解指南，請造訪[文件理解](https://docs.aws.amazon.com/nova/latest/nova2-userguide/using-multimodal-models.html#document-understanding)。

Amazon Nova 的文件理解功能可讓您在提示中包含整份文件 (PDFs、Word 檔案、試算表等），並針對其內容提出問題或請求。Nova 的多模式理解模型 (Lite、Pro、Premier) 可以解譯這些文件中的文字和視覺元素 （例如圖表或資料表）。這可啟用例如問題回答、摘要和分析冗長報告或掃描文件等使用案例。主要功能包括適用於長文件的非常大型內容視窗 (1-2M 字符），以及能夠在單一查詢中處理多個文件。

Amazon Nova 區分兩種類型的文件輸入：
+ **文字型文件類型** （例如 TXT、CSV、Markdown、HTML、DOC)：這些主要針對其文字內容進行處理。Nova 將專注於了解這些文件中的文字並從中擷取資訊。
+ 以**媒體為基礎的文件類型** （例如 PDF、DOCX)：這些檔案可能包含複雜的配置、影像、圖表或內嵌圖形。對於以媒體為基礎的文件，Nova 會同時處理視覺和文字元素。Nova 採用以視覺為基礎的理解來解譯視覺化內容，例如圖表、資料表、圖表或螢幕擷取畫面，以及文件的文字。

  Amazon Nova 中的 PDF 檔案不支援 JPEG2000 和 JBIG2。

支援的檔案格式包括常見的文件類型：純文字和結構化文字檔案 (CSV、TXT)、試算表 (XLS/XLSX)、HTML/Markdown、Word 文件 (DOC/DOCX) 和 PDF 檔案。對於 文件內的影像，會處理標準影像格式 (PNG、JPG、GIF、WebP)，但不支援包含特定影像編碼 (CYMK、SVG) 的 PDFs。


**文件大小限制和使用準則**  

| 限制條件 | 限制 | 
| --- | --- | 
| 文件數量上限 | 每個請求最多 5 個文件 （適用於直接上傳和 Amazon S3) | 
| 文字型文件大小 | 每個文字文件 （例如 .txt、.csv、.md、.html、.doc) 必須 ≤ 4.5 MB | 
| 以媒體為基礎的文件大小 | 對於 .pdf 和 .docx 檔案，沒有個別檔案大小限制，但：[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/nova/latest/userguide/modalities-document.html) | 
| 不支援的 PDF 內容 | 不支援包含 CMYK 顏色描述檔或 SVG 影像PDFs  | 