

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 文本的行和單詞
<a name="how-it-works-lines-words"></a>

由 Amazon Textract 操作返回的檢測到的文本將返回到[Block](API_Block.md)物件。這些對象表示在文檔頁面上檢測到的文本行或文本單詞。以下文本顯示了由多個單詞構成的兩行文本。

這是文字。

在兩個單獨的行。

檢測到的文本將在`Text`欄位`Block`物件。所以此`BlockType`字段確定文本是一行文本 (LINE) 還是單詞 (WORD)。一個*字*是一或多個 ISO 基本拉丁腳本字符，不以空格分隔。一個*線*是製表符分隔和連續單詞的字符串。

 此外，Amazon Textract 將確定一段文本是手寫還是使用`TextTypes`欄位。這些分別作為手寫和印刷返回。

其他`Block`屬性對於所有塊類型（例如 ID、置信度和幾何信息）都是通用的。如需詳細資訊，請參閱 [文本檢測和文檔分析響應對象](how-it-works-document-layout.md)。

要僅檢測行和單詞，您可以使用[DetectDocumentText](API_DetectDocumentText.md)或者[StartDocumentTextDetection](API_StartDocumentTextDetection.md)。如需詳細資訊，請參閱 [偵測文字](how-it-works-detecting.md)。要獲取檢測到的文本（行和單詞）以及有關它與文檔其他部分（如表格）相關的信息，您可以使用[AnalyzeDocument](API_AnalyzeDocument.md)或者[StartDocumentAnalysis](API_StartDocumentAnalysis.md)。如需詳細資訊，請參閱 [分析文檔](how-it-works-analyzing.md)。

`PAGE`、`LINE`，以及`WORD`塊在父-子關係中彼此相關。一個`PAGE`塊是所有`LINE`塊文檔頁面上的對象。因為 LINE 可以有一個或多個單詞，`Relationships`數組存儲組成文本行的子 WORD 塊的 ID。

下圖顯示*Hello world.*在文字*Hello world.* *你怎麼樣*表示為`Block`物件。

![](http://docs.aws.amazon.com/zh_tw/textract/latest/dg/images/hieroglyph-text-detection.png)




以下為來自`DetectDocumentText`當句子*Hello world.* *你怎麼樣*被檢測到。第一個示例是文檔頁面的 JSON。請注意孩子 ID 如何使您能夠在文檔中導航。

```
{
    "Geometry": {...}, 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "d7fbd604-d609-4d69-857d-247a3f591238", // Line - Hello, world.
                "b6c19a93-6493-4d8e-958f-853c8f7ca055" //  Line - How are you?
            ]
        }
    ], 
    "BlockType": "PAGE", 
    "Id": "56ec1d77-171f-4881-9852-2b5b7e761608"
},
```

以下是組成行「你好，世界」的 LINE 塊的 JSON：

```
{
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "7f97e2ca-063e-47a8-981c-8beee31afc01", // Word - Hello,
                "4b990aa0-af96-4369-b90f-dbe02538ed21"  // Word - world.
            ]
        }
    ], 
    "Confidence": 99.63229370117188, 
    "Geometry": {...}, 
    "Text": "Hello, world.", 
    "BlockType": "LINE", 
    "Id": "d7fbd604-d609-4d69-857d-247a3f591238"
},
```

以下是 WORD 塊的 JSON*Hello last*：

```
{
    "Geometry": {...}, 
    "Text": "Hello,", 
    "TextType": "PRINTED",
    "BlockType": "WORD", 
    "Confidence": 99.74746704101562, 
    "Id": "7f97e2ca-063e-47a8-981c-8beee31afc01"
},
```

最後的 JSON 是單詞的 WORD 塊*世界。*：

```
{
    "Geometry": {...}, 
    "Text": "world.",
    "TextType": "PRINTED",
    "BlockType": "WORD", 
    "Confidence": 99.5171127319336, 
    "Id": "4b990aa0-af96-4369-b90f-dbe02538ed21"
},
```