

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Membuat Cetak Biru untuk Ekstraksi
<a name="idp-cases-extraction"></a>

BDA memungkinkan Anda untuk menentukan bidang data tertentu yang ingin Anda ekstrak dari dokumen Anda saat membuat cetak biru. Ini bertindak sebagai seperangkat instruksi yang memandu BDA tentang informasi apa yang harus dicari dan bagaimana menafsirkannya.

**Mendefinisikan bidang**  
Untuk memulai, Anda dapat membuat properti untuk setiap bidang yang memerlukan ekstraksi, seperti employee\$1id atau product\$1name. Untuk setiap bidang, Anda perlu memberikan deskripsi, tipe data, dan tipe inferensi.

Untuk menentukan bidang untuk ekstraksi, Anda perlu menentukan parameter berikut:
+ Nama Bidang: Memberikan penjelasan yang dapat dibaca manusia tentang apa yang diwakili oleh bidang tersebut. Deskripsi ini membantu dalam memahami konteks dan tujuan lapangan, membantu dalam ekstraksi data yang akurat.
+ Instruksi: Memberikan penjelasan bahasa alami tentang apa yang diwakili oleh bidang tersebut. Deskripsi ini membantu dalam memahami konteks dan tujuan lapangan, membantu dalam ekstraksi data yang akurat.
+ Jenis: Menentukan tipe data dari nilai bidang ini. BDA mendukung tipe data berikut:
  + string: Untuk nilai berbasis teks
  + nomor: Untuk nilai numerik
  + boolean: Untuk nilai true/false 
  + array: Untuk bidang yang dapat memiliki beberapa nilai dari jenis yang sama (misalnya, array string atau array angka)
+ Jenis Inferensi: Menginstruksikan BDA tentang cara menangani ekstraksi nilai bidang. Jenis inferensi yang didukung adalah:
  + Eksplisit: BDA harus mengekstrak nilai langsung dari dokumen.
  + Disimpulkan: BDA harus menyimpulkan nilai berdasarkan informasi yang ada dalam dokumen.

Berikut adalah contoh definisi bidang dengan semua parameter:

------
#### [ Console ]

![\[Konsol yang menunjukkan cara menambahkan 'Nama lapangan' dan 'Instruksi'. The 'Type' diatur ke 'String' dan 'Extraction type' diatur ke 'Explicit'.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/bda/bdaadd.png)


------
#### [ API ]

```
"product_name":{
   "type":"string",
   "inferenceType":"Explicit",
   "description":"The short name of the product without any extra details"
}
```

------

Dalam contoh ini:
+ Tipe diatur ke string, menunjukkan bahwa nilai bidang product\$1name harus berbasis teks.
+ InferenceType diatur ke Eksplisit, menginstruksikan BDA untuk mengekstrak nilai langsung dari dokumen tanpa transformasi atau validasi apa pun.
+ Instruksi memberikan konteks tambahan, mengklarifikasi bahwa bidang tersebut harus berisi nama pendek produk tanpa detail tambahan.

Dengan menentukan parameter ini untuk setiap bidang, Anda memberikan BDA informasi yang diperlukan untuk secara akurat mengekstrak dan menafsirkan data yang diinginkan dari dokumen Anda.


| Bidang | Instruksi | Jenis Ekstraksi | Tipe | 
| --- | --- | --- | --- | 
|  ApplicantsName  |  Nama Lengkap Pemohon  |  Eksplisit  |  string  | 
|  DateOfBirth  |  Tanggal lahir karyawan  |  Eksplisit  |  string  | 
|  Penjualan  |  Penerimaan atau penjualan kotor  |  Eksplisit  |  number  | 
|  Pernyataan\$1starting\$1balance  |  Saldo di awal periode  |  Eksplisit  |  number  | 

**Bidang Multi-Nilai**  
Dalam kasus di mana bidang mungkin berisi beberapa nilai, Anda dapat menentukan array atau tabel.

**Daftar Bidang**  
Untuk bidang yang berisi daftar nilai, Anda dapat menentukan tipe data array. 

Dalam contoh ini, "OtherExpenses" didefinisikan sebagai array string, memungkinkan BDA untuk mengekstrak beberapa item pengeluaran untuk bidang itu.

------
#### [ Console ]

![\[Konsol yang menunjukkan cara menambahkan 'Nama lapangan' dan 'Instruksi'. 'Tipe' diatur ke 'Array of String' dan 'Jenis ekstraksi' diatur ke 'Eksplisit '.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/bda/bdaarray.png)


------
#### [ API ]

```
"OtherExpenses":{
   "type":"array",
   "inferenceType":"Explicit",
   "description":"Other business expenses not included in fields 8-26 or field 30",
   "items":{
      "type":"string"
   }
}
```

------

**Tabel**  
Jika dokumen Anda berisi data tabular, Anda dapat menentukan struktur tabel dalam skema.

Dalam contoh ini, “SERVICES\$1TABLE” didefinisikan sebagai tipe Tabel, dengan bidang kolom seperti nama produk, deskripsi, kuantitas, harga satuan dan jumlah.

------
#### [ Console ]

![\[Konsol yang menunjukkan cara menambahkan 'Nama lapangan' dan 'Instruksi'. 'Tipe' diatur ke 'Tabel' dan 'Jenis ekstraksi' diatur ke 'Eksplisit' dan menunjukkan bidang khusus kolom yang ditambahkan.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/bda/bdatable.png)


------
#### [ API ]

```
"definitions":{
   "LINEITEM":{
      "properties":{
         "quantity":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "unit price":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "amount":{
            "type":"number",
            "inferenceType":"Explicit",
            "description":"Unit Price * Quantity"
         },
         "product name":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The short name of the product without any extra details"
         },
         "product description":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The full item list description text"
         }
      }
   }
},
"properties":{
   "SERVICES_TABLE":{
      "type":"array",
      "description":"Line items table listing all the items / services charged in the invoice including quantity, price, amount, product / service name and description.",
      "items":{
         "$ref":"#/definitions/LINEITEM"
      }
   },
   "...
        ..."
]
```

------

Dengan mendefinisikan skema komprehensif dengan deskripsi bidang, tipe data, dan jenis inferensi yang sesuai, Anda dapat memastikan bahwa BDA secara akurat mengekstrak informasi yang diinginkan dari dokumen Anda, terlepas dari variasi dalam pemformatan atau representasi.