

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Objek Tanggapan Amazon Textract
<a name="how-it-works-document-response"></a>

Operasi Amazon Textract Texact mengembalikan berbagai jenis objek tergantung pada operasi yang dijalankan. Untuk mendeteksi teks, dan menganalisis dokumen generik, operasi mengembalikan objek Block. Untuk menganalisis faktur atau tanda terima, operasi mengembalikan objek expenseDocuments. Untuk menganalisis dokumentasi identitas, operasi mengembalikan objek IdentityDocumentFields. Untuk informasi selengkapnya tentang objek respons ini, lihat bagian berikut:

**Topics**
+ [Deteksi Teks dan Dokumen Analisis Respon Objek](how-it-works-document-layout.md)
+ [Faktur dan Respon Tanda Terima Objek](expensedocuments.md)
+ [Identitas Dokumentasi Respon Ob](identitydocumentfields.md)

# Deteksi Teks dan Dokumen Analisis Respon Objek
<a name="how-it-works-document-layout"></a>

Saat Amazon Textract memproses dokumen, dokumen akan membuat daftar[Block](API_Block.md)objek untuk teks terdeteksi atau dianalisis. Setiap blok berisi informasi tentang item yang terdeteksi, di mana letaknya, dan keyakinan yang dimiliki Amazon Textract dalam keakuratan pemrosesan.

Sebuah dokumen terdiri dari jenis berikut`Block`objek.
+ [Halaman](how-it-works-pages.md)
+  [Baris dan kata-kata teks](how-it-works-lines-words.md) 
+  [Data Formulir (Pasangan kunci/nilai)](how-it-works-kvp.md) 
+  [Tabel dan Sel](how-it-works-tables.md) 
+ [Elemen seleksi](how-it-works-selectables.md)

Isi blok tergantung pada operasi yang Anda panggil. Jika Anda memanggil salah satu operasi deteksi teks, halaman, baris, dan kata-kata teks yang terdeteksi akan dikembalikan. Untuk informasi selengkapnya, lihat [Mendeteksi teks](how-it-works-detecting.md). Jika Anda memanggil salah satu operasi analisis dokumen, informasi tentang halaman terdeteksi, pasangan kunci-nilai, tabel, elemen seleksi, dan teks dikembalikan. Untuk informasi selengkapnya, lihat [Menganalisis Dokumen](how-it-works-analyzing.md).

Beberapa`Block`bidang objek umum untuk kedua jenis pengolahan. Misalnya, setiap blok memiliki pengenal yang unik.

Untuk contoh yang menunjukkan cara menggunakan`Block`benda, lihat[Tutorial](examples-blocks.md).

## Tata Letak Dokumen
<a name="hows-it-works-blocks-types.title"></a>

Amazon Textract mengembalikan representasi dokumen sebagai daftar berbagai jenis`Block`objek yang terkait dalam hubungan orangtua-ke-anak atau pasangan kunci-nilai. Metadata yang menyediakan jumlah halaman dalam dokumen juga dikembalikan. Berikut ini adalah JSON untuk khas`Block`objek tipe`PAGE`.

```
{
    "Blocks": [
        {
            "Geometry": {
                "BoundingBox": {
                    "Width": 1.0, 
                    "Top": 0.0, 
                    "Left": 0.0, 
                    "Height": 1.0
                }, 
                "Polygon": [
                    {
                        "Y": 0.0, 
                        "X": 0.0
                    }, 
                    {
                        "Y": 0.0, 
                        "X": 1.0
                    }, 
                    {
                        "Y": 1.0, 
                        "X": 1.0
                    }, 
                    {
                        "Y": 1.0, 
                        "X": 0.0
                    }
                ]
            }, 
            "Relationships": [
                {
                    "Type": "CHILD", 
                    "Ids": [
                        "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", 
                        "82aedd57-187f-43dd-9eb1-4f312ca30042", 
                        "52be1777-53f7-42f6-a7cf-6d09bdc15a30", 
                        "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c"
                    ]
                }
            ], 
            "BlockType": "PAGE", 
            "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97"
        }..... 
        
    ], 
    "DocumentMetadata": {
        "Pages": 1
    }
}
```

Dokumen dibuat dari satu atau lebih`PAGE`blok. Setiap halaman berisi daftar blok anak untuk item utama yang terdeteksi pada halaman, seperti baris teks dan tabel. Untuk informasi selengkapnya, lihat [Halaman](how-it-works-pages.md). 

Anda dapat menentukan jenis`Block`objek dengan memeriksa`BlockType`Bidang.

SEBUAH`Block`objek berisi daftar terkait`Block`benda-benda di`Relationships`lapangan, yang merupakan array[Relationship](API_Relationship.md)objek. SEBUAH`Relationships`array adalah salah satu dari jenis ANAK atau jenis NILAI. Array jenis ANAK digunakan untuk daftar item yang anak-anak dari blok saat ini. Misalnya, jika blok saat ini adalah tipe LINE,`Relationships`berisi daftar ID untuk blok WORD yang membentuk baris teks. Array tipe VALUE digunakan untuk mengandung pasangan nilai kunci. Anda dapat menentukan jenis hubungan dengan memeriksa`Type`bidang`Relationship`objek. 

Blok anak tidak memiliki informasi tentang objek Blokir induknya.

Untuk contoh yang menunjukkan`Block`informasi, lihat[Memproses Dokumen dengan Operasi Sinkron](sync.md).

## Kepercayaan
<a name="how-it-works-confidence"></a>

Operasi Amazon Textract mengembalikan kepercayaan persentase yang dimiliki Amazon Textract dalam keakuratan item yang terdeteksi. Untuk mendapatkan kepercayaan diri, gunakan`Confidence`bidang`Block`objek. Nilai yang lebih tinggi menunjukkan kepercayaan yang lebih tinggi. Tergantung pada skenario, deteksi dengan kepercayaan rendah mungkin memerlukan konfirmasi visual oleh manusia.

## Geometry
<a name="how-it-works-geometry"></a>

Operasi Amazon Textract Texact, dengan pengecualian analisis identitas, mengembalikan informasi lokasi tentang lokasi item yang terdeteksi pada halaman dokumen. Untuk mendapatkan lokasi, gunakan`Geometry`bidang`Block`objek. Untuk informasi selengkapnya, lihat[Lokasi Item pada Halaman Dokumen](text-location.md) 

# Halaman
<a name="how-it-works-pages"></a>

Sebuah dokumen terdiri dari satu atau beberapa halaman. SEBUAH[Block](API_Block.md)objek tipe`PAGE`ada untuk setiap halaman dokumen. SEBUAH`PAGE`blok objek berisi daftar ID anak untuk baris teks, pasangan kunci-nilai, dan tabel yang terdeteksi pada halaman dokumen. 

![\[alt text not found\]](http://docs.aws.amazon.com/id_id/textract/latest/dg/images/hieroglyph-pages.png)


JSON untuk`PAGE`terlihat seperti berikut ini.

```
{

    "Geometry": .... 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", // Line - Hello, world.
                "82aedd57-187f-43dd-9eb1-4f312ca30042", // Line - How are you?
                "52be1777-53f7-42f6-a7cf-6d09bdc15a30", 
                "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c"   
            ]
        }
    ], 
    "BlockType": "PAGE", 
    "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97"  // Page identifier
},
```

Jika Anda menggunakan operasi asinkron dengan dokumen multipage yang ada dalam format PDF, Anda dapat menentukan halaman tempat blok berada di dengan memeriksa`Page`bidang`Block`objek. Gambar yang dipindai (gambar dalam format JPEG, PNG, PDF, atau TIFF) dianggap sebagai dokumen satu halaman, bahkan jika ada lebih dari satu halaman dokumen pada gambar. Operasi asinkron selalu mengembalikan`Page`nilai 1 untuk gambar yang dipindai.

Jumlah total halaman dikembalikan dalam`Pages`bidang`DocumentMetadata`.`DocumentMetadata`dikembalikan dengan setiap daftar`Block`objek yang dikembalikan oleh operasi Amazon Textract.

# Baris dan Kata-kata Teks
<a name="how-it-works-lines-words"></a>

Teks yang terdeteksi yang dikembalikan oleh operasi Amazon Textract Texact dikembalikan dalam daftar[Block](API_Block.md)objek. Benda-benda ini mewakili baris teks atau kata-kata tekstual yang terdeteksi pada halaman dokumen. Teks berikut menunjukkan dua baris teks yang dibuat dari beberapa kata.

Ini adalah teks.

Dalam dua baris terpisah.

Teks yang terdeteksi dikembalikan dalam`Text`bidang a`Block`objek. Parameter`BlockType`bidang menentukan apakah teks adalah baris teks (LINE) atau kata (WORD). SEBUAH*KATA*adalah satu atau lebih karakter skrip Latin dasar ISO yang tidak dipisahkan oleh spasi. SEBUAH*LINI*adalah string kata-kata tab-delimited dan bersebelahan.

 Selain itu, Amazon Textract akan menentukan apakah sepotong teks ditulis tangan atau dicetak menggunakan`TextTypes`Bidang. Ini kembali sebagai TANGAN TANGAN dan DICETAKAN masing-masing. 

Yang lainnya`Block`properti umum untuk semua jenis blok, seperti ID, kepercayaan diri, dan informasi geometri. Untuk informasi selengkapnya, lihat [Deteksi Teks dan Dokumen Analisis Respon Objek](how-it-works-document-layout.md). 

Untuk mendeteksi hanya baris dan kata-kata, Anda dapat menggunakan[DetectDocumentText](API_DetectDocumentText.md)atau[StartDocumentTextDetection](API_StartDocumentTextDetection.md). Untuk informasi selengkapnya, lihat [Mendeteksi teks](how-it-works-detecting.md). Untuk mendapatkan teks yang terdeteksi (baris dan kata-kata) dan informasi tentang bagaimana hal itu berhubungan dengan bagian lain dari dokumen, seperti tabel, Anda dapat menggunakan[AnalyzeDocument](API_AnalyzeDocument.md)atau[StartDocumentAnalysis](API_StartDocumentAnalysis.md). Untuk informasi selengkapnya, lihat [Menganalisis Dokumen](how-it-works-analyzing.md).

`PAGE`,`LINE`, dan`WORD`blok terkait satu sama lain dalam hubungan orang tua-ke-anak. SEBUAH`PAGE`blok adalah induk untuk semua`LINE`blok objek pada halaman dokumen. Karena GARIS dapat memiliki satu atau beberapa kata, maka`Relationships`array untuk blok LINE menyimpan ID untuk blok WORD anak yang membentuk baris teks. 

Diagram berikut menunjukkan bagaimana garis*Halo, dunia.*dalam teks*Halo, dunia. Bagaimana kabarmu?*diwakili oleh`Block`objek. 

![\[alt text not found\]](http://docs.aws.amazon.com/id_id/textract/latest/dg/images/hieroglyph-text-detection.png)




Berikut ini adalah output JSON dari`DetectDocumentText`ketika kalimat*Halo, dunia. Bagaimana kabarmu?*terdeteksi. Contoh pertama adalah JSON untuk halaman dokumen. Perhatikan bagaimana ID ANAK memungkinkan Anda untuk menavigasi dokumen.

```
{
    "Geometry": {...}, 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "d7fbd604-d609-4d69-857d-247a3f591238", // Line - Hello, world.
                "b6c19a93-6493-4d8e-958f-853c8f7ca055" //  Line - How are you?
            ]
        }
    ], 
    "BlockType": "PAGE", 
    "Id": "56ec1d77-171f-4881-9852-2b5b7e761608"
},
```

Berikut ini adalah JSON untuk blok LINE yang membentuk baris “Hello, World”: 

```
{
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "7f97e2ca-063e-47a8-981c-8beee31afc01", // Word - Hello,
                "4b990aa0-af96-4369-b90f-dbe02538ed21"  // Word - world.
            ]
        }
    ], 
    "Confidence": 99.63229370117188, 
    "Geometry": {...}, 
    "Text": "Hello, world.", 
    "BlockType": "LINE", 
    "Id": "d7fbd604-d609-4d69-857d-247a3f591238"
},
```

Berikut ini adalah JSON untuk blok WORD untuk kata*Halo,*: 

```
{
    "Geometry": {...}, 
    "Text": "Hello,", 
    "TextType": "PRINTED",
    "BlockType": "WORD", 
    "Confidence": 99.74746704101562, 
    "Id": "7f97e2ca-063e-47a8-981c-8beee31afc01"
},
```

JSON terakhir adalah blok WORD untuk kata*dunia.*:

```
{
    "Geometry": {...}, 
    "Text": "world.",
    "TextType": "PRINTED",
    "BlockType": "WORD", 
    "Confidence": 99.5171127319336, 
    "Id": "4b990aa0-af96-4369-b90f-dbe02538ed21"
},
```

# Data Formulir (Pasangan Nilai Kunci)
<a name="how-it-works-kvp"></a>

Amazon Textract dapat mengekstrak data formulir dari dokumen sebagai pasangan nilai kunci. Misalnya, dalam teks berikut, Amazon Textract dapat mengidentifikasi kunci (*Nama:*) dan nilai (*Carolina*).

Nama: Carolina

Pasangan nilai kunci dikembalikan sebagai[Block](API_Block.md)objek dalam tanggapan dari[AnalyzeDocument](API_AnalyzeDocument.md)dan[GetDocumentAnalysis](API_GetDocumentAnalysis.md). Anda dapat menggunakan`FeatureTypes`parameter masukan untuk mengambil informasi tentang pasangan kunci-nilai, tabel, atau keduanya. Untuk pasangan kunci-nilai saja, gunakan nilai`FORMS`. Sebagai contoh, lihat [Mengekstrak Pasangan Ky-Value dari Dokumen Formulir](examples-extract-kvp.md). Untuk informasi umum tentang bagaimana dokumen diwakili oleh`Block`benda, lihat[Deteksi Teks dan Dokumen Analisis Respon Objek](how-it-works-document-layout.md). 

Blokir objek dengan tipe KEY\$1VALUE\$1SET adalah wadah untuk objek KEY atau VALUE Block yang menyimpan informasi tentang item teks terkait yang terdeteksi dalam dokumen. Anda dapat menggunakan`EntityType`atribut untuk menentukan apakah blok adalah KEY atau NILAI. 
+ SEBUAH*KUNCI*objek berisi informasi tentang kunci untuk teks terkait. Misalnya,*Nama:*. Sebuah blok KEY memiliki dua daftar hubungan. Sebuah hubungan jenis VALUE adalah daftar yang berisi ID dari blok VALUE terkait dengan kunci. Hubungan tipe ANAK adalah daftar ID untuk blok WORD yang membentuk teks kunci.
+ SEBUAH*NILAI*objek berisi informasi tentang teks yang terkait dengan kunci. Dalam contoh sebelumnya,*Carolina*adalah nilai untuk kunci*Nama:*. Sebuah blok NILAI memiliki hubungan dengan daftar blok ANAK yang mengidentifikasi blok WORD. Setiap blok WORD berisi salah satu kata yang membentuk teks nilai. SEBUAH`VALUE`objek juga dapat berisi informasi tentang elemen yang dipilih. Untuk informasi selengkapnya, lihat [Elemen Seleksi](how-it-works-selectables.md).

Setiap contoh dari KEY\$1VALUE\$1SET`Block`objek adalah anak dari PAGE`Block`objek yang sesuai dengan halaman saat ini.

Diagram berikut menunjukkan bagaimana pasangan nilai kunci*Nama: Carolina*diwakili oleh`Block`objek.

![\[alt text not found\]](http://docs.aws.amazon.com/id_id/textract/latest/dg/images/hieroglyph-key-value-set.png)


Contoh berikut menunjukkan bagaimana pasangan nilai kunci*Nama: Carolina*diwakili oleh JSON.

Blok PAGE memiliki blok ANAK tipe`KEY_VALUE_SET`untuk setiap KEY dan blok NILAI terdeteksi dalam dokumen. 

```
{
    "Geometry": .... 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", 
                "82aedd57-187f-43dd-9eb1-4f312ca30042", 
                "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name:
                "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c"  // Value - Ana Caroline 
            ]
        }
    ], 
    "BlockType": "PAGE", 
    "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97"  // Page identifier
},
```

JSON berikut menunjukkan bahwa blok KEY (52be1777-53f7-42f6-a7cf-6d09bdc15a30) memiliki hubungan dengan blok NILAI (7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c). Ini juga memiliki blok ANAK untuk blok WORD (c734fca6-c4c4-415c-b6c1-30f7510b72ea) yang berisi teks untuk kunci (*Nama:*).

```
{
    "Relationships": [
        {
            "Type": "VALUE", 
            "Ids": [
                "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c"  // Value identifier
            ]
        }, 
        {
            "Type": "CHILD", 
            "Ids": [
                "c734fca6-c4c4-415c-b6c1-30f7510b72ee"  // Name:
            ]
        }
    ], 
    "Confidence": 51.55965805053711, 
    "Geometry": ...., 
    "BlockType": "KEY_VALUE_SET", 
    "EntityTypes": [
        "KEY"
    ], 
    "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30"  //Key identifier
},
```

JSON berikut menunjukkan bahwa VALUE blok 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c memiliki daftar ANAK ID untuk blok WORD yang membentuk teks dari nilai (*Ana*dan*Carolina*).

```
{
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana
                "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3"  // Carolina
            ]
        }
    ], 
    "Confidence": 51.55965805053711, 
    "Geometry": ...., 
    "BlockType": "KEY_VALUE_SET", 
    "EntityTypes": [
        "VALUE"
    ], 
    "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier
}
```

JSON berikut menunjukkan`Block`objek untuk kata-kata*Nama:*,*Ana*, dan*Carolina*.

```
{
    "Geometry": {...}, 
    "Text": "Name:", 
    "TextType": "PRINTED".
    "BlockType": "WORD", 
    "Confidence": 99.56285858154297, 
    "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee"
},
 {
    "Geometry": {...}, 
    "Text": "Ana", 
    "TextType": "PRINTED",
    "BlockType": "WORD", 
    "Confidence": 99.52057647705078, 
    "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a"
}, 
{
    "Geometry": {...}, 
    "Text": "Carolina", 
    "TextType": "PRINTED",
    "BlockType": "WORD", 
    "Confidence": 99.84207916259766, 
    "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3"
},
```

# Tabel
<a name="how-it-works-tables"></a>

Amazon Textract dapat mengekstrak tabel dan sel dalam tabel. Misalnya, ketika tabel berikut terdeteksi pada formulir, Amazon Textract mendeteksi tabel dengan empat sel. 


| Nama | Alamat | 
| --- | --- | 
|  Carolina  |  123 Kota mana pun  | 

Tabel yang terdeteksi dikembalikan sebagai[Block](API_Block.md)objek dalam tanggapan dari[AnalyzeDocument](API_AnalyzeDocument.md)dan[GetDocumentAnalysis](API_GetDocumentAnalysis.md). Anda dapat menggunakan`FeatureTypes`parameter masukan untuk mengambil informasi tentang pasangan kunci-nilai, tabel, atau keduanya. Untuk tabel saja, gunakan nilainya`TABLES`. Sebagai contoh, lihat [Mengekspor Tabel ke File CSV](examples-export-table-csv.md). Untuk informasi umum tentang bagaimana dokumen diwakili oleh`Block`benda, lihat[Deteksi Teks dan Dokumen Analisis Respon Objek](how-it-works-document-layout.md).

Diagram berikut menunjukkan bagaimana sel tunggal dalam tabel diwakili oleh`Block`objek.

![\[alt text not found\]](http://docs.aws.amazon.com/id_id/textract/latest/dg/images/hieroglyph-table-cell.png)


Sel mengandung`WORD`blok untuk kata-kata yang terdeteksi, dan`SELECTION_ELEMENT`blok untuk elemen seleksi seperti kotak centang. 

Berikut ini adalah JSON partial untuk tabel sebelumnya, yang memiliki empat sel.

Objek PAGE Block memiliki daftar ID Blok ANAK untuk blok TABLE dan setiap LINE teks yang terdeteksi. 

```
{
    "Geometry": {...}, 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "f2a4ad7b-f21d-4966-b548-c859b84f66a4",   // Line - Name
                "4dce3516-ffeb-45e0-92a2-60770e9cb744",   // Line  - Address 
                "ee506578-768f-4696-8f4b-e4917e429f50",   // Line - Ana Carolina
                "33fc7223-411b-4399-8a90-ccd3c5a2c196",   // Line  - 123 Any Town
                "3f9665be-379d-4ae7-be44-d02f32b049c2"    // Table
            ]
        }
    ], 
    "BlockType": "PAGE", 
    "Id": "78c3ce84-ae70-418e-add7-27058418adf6"
},
```

Blok TABLE mencakup daftar ID anak untuk sel-sel dalam tabel. Sebuah blok TABLE juga mencakup informasi geometri untuk lokasi tabel dalam dokumen. JSON berikut menunjukkan bahwa tabel memiliki empat sel, yang tercantum dalam`Ids`array.

```
{
    "Geometry": {...}, 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "505e9581-0d1c-42fb-a214-6ff736822e8c", 
                "6fca44d4-d3d3-46ab-b22f-7fca1fbaaf02", 
                "9778bd78-f3fe-4ae1-9b78-e6d29b89e5e9", 
                "55404b05-ae12-4159-9003-92b7c129532e"
            ]
        }
    ], 
    "BlockType": "TABLE", 
    "Confidence": 92.5705337524414, 
    "Id": "3f9665be-379d-4ae7-be44-d02f32b049c2"
},
```

Jenis Blok untuk sel tabel adalah CELL. Parameter`Block`objek untuk setiap sel mencakup informasi tentang lokasi sel dibandingkan dengan sel-sel lain dalam tabel. Ini juga mencakup informasi geometri untuk lokasi sel pada dokumen. Dalam contoh sebelumnya,`505e9581-0d1c-42fb-a214-6ff736822e8c`adalah ID anak untuk sel yang berisi kata*Nama*. Contoh berikut adalah informasi untuk sel. 

```
{
    "Geometry": {...}, 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "e9108c8e-0167-4482-989e-8b6cd3c3653e"
            ]
        }
    ], 
    "Confidence": 100.0, 
    "RowSpan": 1, 
    "RowIndex": 1, 
    "ColumnIndex": 1, 
    "ColumnSpan": 1, 
    "BlockType": "CELL", 
    "Id": "505e9581-0d1c-42fb-a214-6ff736822e8c"
},
```

Setiap sel memiliki lokasi di meja, dengan sel pertama menjadi 1,1. Pada contoh sebelumnya, sel dengan nilai*Nama*adalah di baris 1, kolom 1. Sel dengan nilai*123 Kota mana pun*adalah di baris 2, kolom 2. Sebuah objek blok sel berisi informasi ini di`RowIndex`dan`ColumnIndex`bidang. Daftar anak berisi ID untuk objek WORD Block yang berisi teks yang ada di dalam sel. Kata-kata dalam daftar berada dalam urutan di mana mereka terdeteksi, dari kiri atas sel ke kanan bawah sel. Pada contoh sebelumnya, sel memiliki ID anak dengan nilai e9108c8e-0167-4482-989e-8b6cd3c3653e. Output berikut adalah untuk Blok WORD dengan nilai ID e9108c8e-0167-4482-989e-8b6cd3c3653e: 

```
"Geometry": {...}, 
"Text": "Name", 
"TextType": "Printed",
"BlockType": "WORD",
"Confidence": 99.81139373779297, 
"Id": "e9108c8e-0167-4482-989e-8b6cd3c3653e"
},
```

# Elemen Seleksi
<a name="how-it-works-selectables"></a>

Amazon Textract dapat mendeteksi elemen pilihan seperti tombol opsi (tombol radio) dan kotak centang pada halaman dokumen. elemen seleksi dapat dideteksi di[data formulir](how-it-works-kvp.md)dan di[tabel](how-it-works-tables.md). Misalnya, ketika tabel berikut terdeteksi pada formulir, Amazon Textract mendeteksi kotak centang di sel tabel.


|  |  |  |  | 
| --- |--- |--- |--- |
|     |  **Setuju**  |  **Netral**  |  **Tidak Setuju**  | 
|  **Pelayanan yang Baik**  |  ☑  |  ☐  |  ☐  | 
|  **Mudah digunakan**  |  ☐  |  ☑  |  ☐  | 
|  **Harga yang adil**  |  ☑  |  ☐  |  ☐  | 

elemen seleksi terdeteksi dikembalikan sebagai[Block](API_Block.md)objek dalam tanggapan dari[AnalyzeDocument](API_AnalyzeDocument.md)dan[GetDocumentAnalysis](API_GetDocumentAnalysis.md).

**catatan**  
Anda dapat menggunakan`FeatureTypes`parameter masukan untuk mengambil informasi tentang pasangan kunci-nilai, tabel, atau keduanya. Misalnya, jika Anda memfilter pada tabel, respon mencakup elemen seleksi yang terdeteksi dalam tabel. Elemen seleksi yang terdeteksi dalam pasangan kunci-nilai tidak termasuk dalam respon.

Informasi tentang elemen seleksi terkandung dalam`Block`objek tipe`SELECTION_ELEMENT`. Untuk menentukan status elemen yang dapat dipilih, gunakan`SelectionStatus`bidang`SELECTION_ELEMENT`blok. Status dapat berupa*TERPILIH*atau*NOT\$1SELECTED*. Misalnya, nilai`SelectionStatus`untuk gambar sebelumnya adalah*TERPILIH*.

SEBUAH`SELECTION_ELEMENT` `Block`objek terkait dengan pasangan nilai kunci atau sel tabel. SEBUAH`SELECTION_ELEMENT` `Block`objek berisi informasi kotak pembatas untuk elemen seleksi di`Geometry`Bidang. SEBUAH`SELECTION_ELEMENT` `Block`objek bukan anak`PAGE` `Block`objek.

## Data Formulir (Pasangan Nilai Kunci)
<a name="how-it-works-selectable-kvp"></a>

Pasangan kunci-nilai digunakan untuk mewakili elemen seleksi yang terdeteksi pada formulir. Parameter`KEY`blok berisi teks untuk elemen seleksi. Parameter`VALUE`blok berisi blok SELECTION\$1ELEMENT. Diagram berikut menunjukkan bagaimana elemen seleksi diwakili oleh[Block](API_Block.md)objek.

![\[alt text not found\]](http://docs.aws.amazon.com/id_id/textract/latest/dg/images/hieroglyph-key-value-set-selectable.png)


Untuk informasi selengkapnya tentang pasangan nilai kunci, lihat[Data Formulir (Pasangan Nilai Kunci)](how-it-works-kvp.md).

Cuplikan JSON berikut menunjukkan kunci untuk pasangan kunci-nilai yang berisi elemen seleksi (**Laki-Laki ☑**). ID anak (Id bd14cfd5-9005-498b-a7f3-45ceb171f0ff) adalah ID dari blok WORD yang berisi teks untuk elemen seleksi (*jantan*). ID nilai (Id 24aaac7f-fcce-49c7-a4f0-3688b05586d4) adalah ID`VALUE`blok yang berisi`SELECTION_ELEMENT`objek blok.

```
{
    "Relationships": [
        {
            "Type": "VALUE", 
            "Ids": [
                "24aaac7f-fcce-49c7-a4f0-3688b05586d4"  // Value containing Selection Element
            ]
        }, 
        {
            "Type": "CHILD", 
            "Ids": [
                "bd14cfd5-9005-498b-a7f3-45ceb171f0ff"  // WORD - male
            ]
        }
    ], 
    "Confidence": 94.15619659423828, 
    "Geometry": {
        "BoundingBox": {
            "Width": 0.022914813831448555, 
            "Top": 0.08072036504745483, 
            "Left": 0.18966935575008392, 
            "Height": 0.014860388822853565
        }, 
        "Polygon": [
            {
                "Y": 0.08072036504745483, 
                "X": 0.18966935575008392
            }, 
            {
                "Y": 0.08072036504745483, 
                "X": 0.21258416771888733
            }, 
            {
                "Y": 0.09558075666427612, 
                "X": 0.21258416771888733
            }, 
            {
                "Y": 0.09558075666427612, 
                "X": 0.18966935575008392
            }
        ]
    }, 
    "BlockType": "KEY_VALUE_SET", 
    "EntityTypes": [
        "KEY"
    ], 
    "Id": "a118dc43-d5f7-49a2-a20a-5f876d9ffd79"
}
```

Potongan JSON berikut adalah blok WORD untuk kata*Laki-laki*. Blok WORD juga memiliki blok LINE induk.

```
{
    "Geometry": {
        "BoundingBox": {
            "Width": 0.022464623674750328, 
            "Top": 0.07842985540628433, 
            "Left": 0.18863198161125183, 
            "Height": 0.01617223583161831
        }, 
        "Polygon": [
            {
                "Y": 0.07842985540628433, 
                "X": 0.18863198161125183
            }, 
            {
                "Y": 0.07842985540628433, 
                "X": 0.2110965996980667
            }, 
            {
                "Y": 0.09460209310054779, 
                "X": 0.2110965996980667
            }, 
            {
                "Y": 0.09460209310054779, 
                "X": 0.18863198161125183
            }
        ]
    }, 
    "Text": "Male", 
    "BlockType": "WORD", 
    "Confidence": 54.06439208984375, 
    "Id": "bd14cfd5-9005-498b-a7f3-45ceb171f0ff"
},
```

Blok VALUE memiliki anak (Id f2f5e8cd-e73a-4e99-a095-053acd3b6bfb) yang merupakan blok SELECTION\$1ELEMENT. 

```
{
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "f2f5e8cd-e73a-4e99-a095-053acd3b6bfb"  // Selection element
            ]
        }
    ], 
    "Confidence": 94.15619659423828, 
    "Geometry": {
        "BoundingBox": {
            "Width": 0.017281491309404373, 
            "Top": 0.07643391191959381, 
            "Left": 0.2271782010793686, 
            "Height": 0.026274094358086586
        }, 
        "Polygon": [
            {
                "Y": 0.07643391191959381, 
                "X": 0.2271782010793686
            }, 
            {
                "Y": 0.07643391191959381, 
                "X": 0.24445968866348267
            }, 
            {
                "Y": 0.10270800441503525, 
                "X": 0.24445968866348267
            }, 
            {
                "Y": 0.10270800441503525, 
                "X": 0.2271782010793686
            }
        ]
    }, 
    "BlockType": "KEY_VALUE_SET", 
    "EntityTypes": [
        "VALUE"
    ], 
    "Id": "24aaac7f-fcce-49c7-a4f0-3688b05586d4"
}, 
}
```

JSON berikut adalah blok SELECTION\$1ELEMENT. Nilai dari`SelectionStatus`menunjukkan bahwa kotak centang dipilih.

```
{
    "Geometry": {
        "BoundingBox": {
            "Width": 0.020316146314144135, 
            "Top": 0.07575977593660355, 
            "Left": 0.22590067982673645, 
            "Height": 0.027631107717752457
        }, 
        "Polygon": [
            {
                "Y": 0.07575977593660355, 
                "X": 0.22590067982673645
            }, 
            {
                "Y": 0.07575977593660355, 
                "X": 0.2462168186903
            }, 
            {
                "Y": 0.1033908873796463, 
                "X": 0.2462168186903
            }, 
            {
                "Y": 0.1033908873796463, 
                "X": 0.22590067982673645
            }
        ]
    }, 
    "BlockType": "SELECTION_ELEMENT", 
    "SelectionStatus": "SELECTED", 
    "Confidence": 74.14942932128906, 
    "Id": "f2f5e8cd-e73a-4e99-a095-053acd3b6bfb"
}
```

## Sel tabel
<a name="how-it-works-selectable-table"></a>

Amazon Textract dapat mendeteksi elemen seleksi di dalam sel tabel. Misalnya, sel-sel dalam tabel berikut memiliki kotak centang.


|  |  |  |  | 
| --- |--- |--- |--- |
|     |  **Setuju**  |  **Netral**  |  **Tidak Setuju**  | 
|  **Pelayanan yang Baik**  |  ☑  |  ☐  |  ☐  | 
|  **Mudah digunakan**  |  ☐  |  ☑  |  ☐  | 
|  **Harga yang adil**  |  ☑  |  ☐  |  ☐  | 

SEBUAH`CELL`blok dapat berisi anak`SELECTION_ELEMENT`objek untuk elemen seleksi, serta anak`WORD`blok untuk teks terdeteksi.

![\[alt text not found\]](http://docs.aws.amazon.com/id_id/textract/latest/dg/images/hieroglyph-table-cell-selectable.png)


Untuk informasi selengkapnya, lihat[Tabel](how-it-works-tables.md).

TABLE`Block`objek untuk tabel sebelumnya terlihat mirip dengan ini.

```
{
    "Geometry": {.....}, 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "652c09eb-8945-473d-b1be-fa03ac055928", 
                "37efc5cc-946d-42cd-aa04-e68e5ed4741d", 
                "4a44940a-435a-4c5c-8a6a-7fea341fa295", 
                "2de20014-9a3b-4e26-b453-0de755144b1a", 
                "8ed78aeb-5c9a-4980-b669-9e08b28671d2", 
                "1f8e1c68-2c97-47b2-847c-a19619c02ca9", 
                "9927e1d1-6018-4960-ac17-aadb0a94f4d9", 
                "68f0ed8b-a887-42a5-b618-f68b494a6034", 
                "fcba16e0-6bd7-4ea5-b86e-36e8330b68ea", 
                "2250357c-ae34-4ed9-86da-45dac5a5e903", 
                "c63ad40d-5a14-4646-a8df-2d4304213dbc",   // Cell
                "2b8417dc-e65f-4fcd-aa0f-61a23f1e8cb0", 
                "26c62932-72f0-4dc2-9893-1ae27829c060", 
                "27f291cc-abf4-4c23-aa24-676abe99cb1e", 
                "7e5ce028-1bcd-4d9f-ad42-15ac181c5b47", 
                "bf32e3d2-efa2-4fc1-b09b-ab9cc52ff734"
            ]
        }
    ], 
    "BlockType": "TABLE", 
    "Confidence": 99.99993896484375, 
    "Id": "f66eac36-2e74-406e-8032-14d1c14e0b86"
}
```

CEL`BLOCK`objek (Id c63ad40d-5a14-4646-a8df-2d4304213dbc) untuk sel yang berisi kotak centang*Pelayanan yang Baik*terlihat seperti berikut ini. Ini termasuk seorang anak`Block`(Id = 26d122fd-c5f4-4b53-92c4-0ae92730ee1e) itu adalah`SELECTION_ELEMENT` `Block`untuk kotak centang.

```
{
    "Geometry": {.....}, 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "26d122fd-c5f4-4b53-92c4-0ae92730ee1e"  // Selection Element
            ]
        }
    ], 
    "Confidence": 79.741689682006836, 
    "RowSpan": 1, 
    "RowIndex": 3, 
    "ColumnIndex": 3, 
    "ColumnSpan": 1, 
    "BlockType": "CELL", 
    "Id": "c63ad40d-5a14-4646-a8df-2d4304213dbc"
}
```

SELECTION\$1ELEMENT`Block`objek untuk kotak centang adalah sebagai berikut. Nilai dari`SelectionStatus`menunjukkan bahwa kotak centang dipilih.

```
{
    "Geometry": {.......}, 
    "BlockType": "SELECTION_ELEMENT", 
    "SelectionStatus": "SELECTED", 
    "Confidence": 88.79517364501953, 
    "Id": "26d122fd-c5f4-4b53-92c4-0ae92730ee1e"
}
```

# Faktur dan Respon Tanda Terima Objek
<a name="expensedocuments"></a>

Ketika Anda mengirimkan faktur atau tanda terima ke AnalyzeExpense API, ia mengembalikan serangkaian objek ExpenseDocuments. Setiap expenseDocument selanjutnya dipisahkan menjadi`LineItemGroups`dan`SummaryFields`. Sebagian besar faktur dan tanda terima berisi informasi seperti nama vendor, nomor tanda terima, tanggal penerimaan, atau jumlah total. AnalyzeExpense mengembalikan informasi ini di bawah`SummaryFields`. Tanda terima dan faktur juga berisi rincian tentang barang yang dibeli. AnalyzeExpense API mengembalikan informasi ini di bawah`LineItemGroups`. Parameter`ExpenseIndex`lapangan unik mengidentifikasi biaya, dan mengaitkan yang sesuai`SummaryFields`dan`LineItemGroups`terdeteksi dalam biaya itu.

Tingkat data yang paling terperinci dalam respons AnalyzeExpense terdiri dari`Type`,`ValueDetection`, dan`LabelDetection`(Opsional). Entitas individu adalah:
+ [Tipe](how-it-works-type.md): Mengacu pada jenis informasi apa yang terdeteksi pada tingkat tinggi.
+ [LabelDetection](how-it-works-labeldetection.md): Mengacu pada label nilai terkait dalam teks dokumen.`LabelDetection`adalah opsional dan hanya dikembalikan jika label ditulis.
+ [ValueDetection](how-it-works-valuedetection.md): Mengacu pada nilai label atau jenis dikembalikan.

AnalyzeExpense API juga mendeteksi`ITEM`,`QUANTITY`, dan`PRICE`dalam item baris sebagai bidang dinormalisasi. Jika ada teks lain dalam item baris pada gambar tanda terima seperti SKU atau deskripsi rinci, maka akan dimasukkan dalam JSON sebagai`EXPENSE_ROW`seperti yang ditunjukkan pada contoh di bawah ini:

```
               {
                                    "Type": {
                                        "Text": "EXPENSE_ROW",
                                        "Confidence": 99.95216369628906
                                    },
                                    "ValueDetection": {
                                        "Text": "Banana 5 $2.5",
                                        "Geometry": {
                                          …
                                        },
                                        "Confidence": 98.11214447021484
                                    }
```

Contoh di atas menunjukkan bagaimana AnalyzeExpense API mengembalikan seluruh baris pada tanda terima yang berisi informasi item baris tentang 5 pisang dijual seharga \$12.5. 

# Tipe
<a name="how-it-works-type"></a>

Berikut ini adalah contoh tipe standar atau normalisasi dari pasangan nilai kunci:

```
               {
                    "PageNumber": 1, 
                    "Type": {
                        "Text": "VENDOR_NAME", 
                        "Confidence": 70.0
                    }, 
                    "ValueDetection": {
                        "Geometry": { ... }, 
                        "Text": "AMAZON", 
                        "Confidence": 87.89806365966797
                    }
                }
```

Tanda terima tidak memiliki “Nama Penjual” secara eksplisit terdaftar. Namun, Analyze Expense API mengakui dokumen sebagai tanda terima dan mengkategorikan nilai “AMAZON” sebagai Type`VENDOR_NAME`. 

# LabelDetection
<a name="how-it-works-labeldetection"></a>

Berikut ini adalah contoh teks seperti yang ditunjukkan pada halaman dokumen pelanggan:

```
               {
                    "PageNumber": 1, 
                    "Type": {
                        "Text": "OTHER", 
                        "Confidence": 70.0
                    }, 
                    "LabelDetection": {
                        "Geometry": { ... }, 
                        "Text": "CASHIER", 
                        "Confidence": 88.19171142578125
                    }, 
                    "ValueDetection": {
                        "Geometry": { ... }, 
                        "Text": "Mina", 
                        "Confidence": 87.89806365966797
                    }
                }
```

Contoh dokumen berisi “CASHIER Mina”. Analyze Expense API mengekstrak apa adanya nilai dan mengembalikannya di bawah`LabelDetection`. Untuk nilai tersirat seperti “Nama Penjual”, di mana “kunci” tidak ditampilkan secara eksplisit dalam tanda terima,`LabelDetection`tidak akan disertakan dalam elemen AnalyzeExpense. Dalam kasus tersebut, AnalyzeExpense API tidak kembali`LabelDetection`. 

# ValueDetection
<a name="how-it-works-valuedetection"></a>

Berikut ini adalah contoh menunjukkan “nilai” dari pasangan nilai kunci.

```
               {
                    "PageNumber": 1, 
                    "Type": {
                        "Text": "OTHER", 
                        "Confidence": 70.0
                    }, 
                    "LabelDetection": {
                        "Geometry": { ... }, 
                        "Text": "CASHIER", 
                        "Confidence": 88.19171142578125
                    }, 
                    "ValueDetection": {
                        "Geometry": { ... }, 
                        "Text": "Mina", 
                        "Confidence": 87.89806365966797
                    }
                }
```

Dalam contoh, dokumen berisi “CASHIER Mina”. AnalyzeExpense API mendeteksi nilai Kasir sebagai Mina dan mengembalikannya di bawah`ValueDetection`. 

# Identitas Dokumentasi Respon Ob
<a name="identitydocumentfields"></a>

 Ketika Anda mengirimkan dokumen identitas ke AnalyzeID API, ia mengembalikan serangkaian`IdentityDocumentField`objek. Masing-masing benda-benda ini berisi`Type`, dan`Value`.`Type`mencatat bidang dinormalisasi yang Amazon Textract mendeteksi, dan`Value`mencatat teks yang terkait dengan bidang dinormalisasi. 

 Di bawah ini adalah contoh`IdentityDocumentField`, dipersingkat untuk singkatnya. 

```
{
    "DocumentMetadata": {
        "Pages": 1
    }, 
    "IdentityDocumentFields": [
        {
            "Type": {
                "Text": "first name"
            }, 
            "ValueDetection": {
                "Text": "jennifer", 
                "Confidence": 99.99908447265625
            }
        }, 
        {
            "Type": {
                "Text": "last name"
            }, 
            "ValueDetection": {
                "Text": "sample", 
                "Confidence": 99.99758911132812
            }
        },
```

 Ini adalah dua contoh IdentityDocumentFields dipotong dari respon yang lebih panjang. Ada pemisahan antara jenis terdeteksi dan nilai untuk jenis itu. Di sini, itu adalah nama pertama dan belakang masing-masing. Struktur ini berulang dengan semua informasi yang terkandung. Jika tipe tidak diakui sebagai bidang dinormalisasi, maka akan terdaftar sebagai “lainnya”. 

Berikut ini adalah daftar bidang dinormalisasi untuk SIM:
+  Nama Depan 
+  Nama belakang 
+  Nama Tengah 
+  akhiran 
+  alamat kota 
+  kode pos di alamat 
+  alamat 
+  county 
+  nomor dokumen 
+  Tanggal kedaluwarsa 
+  tanggal lahir 
+  nama negara 
+  tanggal penerbitan 
+  kelas 
+  pembatasan 
+  dukungan 
+  Tipe id 
+  kawakan 
+  menegur 

Berikut ini adalah daftar bidang dinormalisasi untuk Paspor AS:
+  Nama Depan 
+  Nama belakang 
+  Nama Tengah 
+  nomor dokumen 
+  Tanggal kedaluwarsa 
+  tanggal lahir 
+ tempat lahir
+  tanggal penerbitan 
+  Tipe id 