

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 分析發票和收款
<a name="invoices-receipts"></a>

Amazon Textract 從幾乎任何發票或收據中提取相關數據，例如聯繫信息、購買的商品和供應商名稱，而無需任何模板或配置。發票和收據通常使用各種佈局，因此很難大規模手動提取數據。Amazon Textract 使用 ML 來瞭解發票和收據的上下文，並自動提取發票或收據日期、發票或收據編號、商品價格、總金額和付款條件等數據，以滿足您的業務需求。

Amazon Textract 還會識別對您的工作流程至關重要但未明確標記的供應商名稱。例如，Amazon Textract 可以在收據上找到供應商名稱，即使該名稱僅在頁面頂部的徽標中顯示，而沒有明確的鍵值對組合。Amazon Textract 還可以讓您輕鬆整合不同收據和發票的輸入，這些收據和發票為同一概念使用不同詞語。例如，Amazon Textract 會映射不同文檔中的字段名稱之間的關係，例如客户編號、客户編號和賬户 ID，並將標準分類輸出為`INVOICE_RECEIPT_ID`。在這種情況下，Amazon Textract 會在不同文檔類型中一致地表示數據。與標準分類不一致的字段被歸類為`OTHER`。

以下為分析費用目前支持的標準字段清單：
+ 廠商名稱：`VENDOR_NAME`
+ 資料總數：`TOTAL`
+ 接收方地址：`RECEIVER_ADDRESS`
+ 發票/接收日期：`INVOICE_RECEIPT_DATE`
+ 發票/收據編號：`INVOICE_RECEIPT_ID`
+ 付款條件：`PAYMENT_TERMS`
+ 小計：`SUBTOTAL`
+ 截止日期：`DUE_DATE`
+ 務：`TAX`
+ 發票納税人編號（SSN/ITIN 或 EIN）：`TAX_PAYER_ID`
+ 項目名稱：`ITEM_NAME`
+ 商品價格：`PRICE`
+ 商品數量：`QUANTITY`

分析費用 API 返回給定文檔頁面的以下元素：
+ 頁面內的收據或發票數量，表示為`ExpenseIndex`
+ 單個字段的標準化名稱，表示為`Type`
+ 字段的實際名稱，如文件中所顯示的欄位名稱，表示為`LabelDetection`
+ 對應字段的值表示為`ValueDetection`
+ 所提交文檔中的頁數表示為`Pages`
+ 檢測到字段、值或行項目的頁碼，表示為`PageNumber`
+ 幾何，其中包括頁面上各個字段、值或行項目的邊界框和座標位置，表示為`Geometry`
+ 與文檔上檢測到的每個數據段相關聯的置信度分數，表示為`Confidence`
+ 購買的單個行項目的整行，表示為`EXPENSE_ROW`

以下是由分析費用處理的收據的 API 輸出的一部分，顯示合計：55.64 在文檔中提取為標準字段`TOTAL`, 文檔上的實際文本為「總」, 置信度分為「97.1」, 頁碼「1」, 總值為「$55.64」和邊界框和多邊形座標: 

```
{
    "Type": {
        "Text": "TOTAL",
        "Confidence": 99.94717407226562
    },
    "LabelDetection": {
        "Text": "Total:",
        "Geometry": {
            "BoundingBox": {
                "Width": 0.09809663146734238,
                "Height": 0.0234375,
                "Left": 0.36822840571403503,
                "Top": 0.8017578125
            },
            "Polygon": [
                {
                    "X": 0.36822840571403503,
                    "Y": 0.8017578125
                },
                {
                    "X": 0.466325044631958,
                    "Y": 0.8017578125
                },
                {
                    "X": 0.466325044631958,
                    "Y": 0.8251953125
                },
                {
                    "X": 0.36822840571403503,
                    "Y": 0.8251953125
                }
        ]
    },
    "Confidence": 97.10792541503906
},
    "ValueDetection": {
        "Text": "$55.64",
        "Geometry": {
            "BoundingBox": {
                "Width": 0.10395314544439316,
                "Height": 0.0244140625,
                "Left": 0.66837477684021,
                "Top": 0.802734375
            },
            "Polygon": [
                {
                    "X": 0.66837477684021,
                    "Y": 0.802734375
                },
                {
                    "X": 0.7723279595375061,
                    "Y": 0.802734375
                },
                {
                    "X": 0.7723279595375061,
                    "Y": 0.8271484375
                },
                {
                    "X": 0.66837477684021,
                    "Y": 0.8271484375
                }
            ]
        },
    "Confidence": 99.85165405273438
},
"PageNumber": 1
}
```

您可以使用同步操作來分析發票或收據。若要分析這些單據，您可以使用 AnalyzeFesments 操作並將收據或發票傳遞給它。`AnalyzeExpense`返回整組結果。如需詳細資訊，請參閱 [使用 Amazon Textract 分析發票和收據](analyzing-document-expense.md)。

若要異步分析發票和收據，請使用[StartExpenseAnalysis](API_StartExpenseAnalysis.md)開始處理輸入文檔文件。若要獲取結果，請調用[GetExpenseAnalysis](API_GetExpenseAnalysis.md)。給定調用的結果[StartExpenseAnalysis](API_StartExpenseAnalysis.md)返回的`GetExpenseAnalysis`。如需詳細資訊和範例，請參閱 [使用異步操作處理文檔](async.md)。