

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Operasi API analisis teks
<a name="comprehendmedical-textanalysis"></a>

Gunakan Amazon Comprehend Medical untuk memeriksa dokumen klinis dan untuk mendapatkan berbagai wawasan tentang konten mereka menggunakan model pemrosesan bahasa alami (NLP) pra-terlatih. Anda dapat melakukan analisis baik pada file tunggal atau sebagai analisis batch pada beberapa file yang disimpan dalam bucket Amazon Simple Storage Service (S3) Amazon Simple Storage Service (S3).

Dengan Amazon Comprehend Medical, Anda dapat melakukan hal berikut pada dokumen Anda:
+ [Mendeteksi entitas (Versi 2)](textanalysis-entitiesv2.md)Memeriksa teks klinis yang tidak terstruktur untuk mendeteksi referensi tekstual untuk informasi medis seperti kondisi medis, pengobatan, tes dan hasil, dan obat-obatan. Versi ini menggunakan model yang berbeda dari API entitas Detect asli, dan ada beberapa perubahan dalam output.
+ [Mendeteksi PHI](textanalysis-phi.md)Periksa teks klinis yang tidak terstruktur untuk mendeteksi referensi tekstual ke informasi kesehatan yang dilindungi (PHI) seperti nama dan alamat.

Amazon Comprehend Medical juga menyertakan beberapa operasi API yang dapat Anda gunakan untuk melakukan analisis teks batch pada dokumen klinis. Untuk mempelajari lebih lanjut tentang cara menggunakan operasi API ini, lihat[Batch analisis teks APIs](textanalysis-batchapi.md).

**Topics**
+ [Mendeteksi entitas (Versi 2)](textanalysis-entitiesv2.md)
+ [Mendeteksi PHI](textanalysis-phi.md)
+ [Batch analisis teks APIs](textanalysis-batchapi.md)

# Mendeteksi entitas (Versi 2)
<a name="textanalysis-entitiesv2"></a>

Gunakan **DetectEntitiesV2** untuk mendeteksi entitas dalam file tunggal atau **StartEntitiesDetectionV2Job** untuk analisis batch pada beberapa file. Anda dapat mendeteksi entitas dalam kategori berikut:
+ `ANATOMY:`Mendeteksi referensi ke bagian-bagian tubuh atau sistem tubuh dan lokasi bagian atau sistem tersebut.
+ `BEHAVIORAL_ENVIRONMENTAL_SOCIAL`: Mendeteksi perilaku dan kondisi di lingkungan yang berdampak pada kesehatan seseorang. Ini termasuk penggunaan tembakau, konsumsi alkohol, penggunaan narkoba rekreasi, alergi, jenis kelamin, dan ras/etnis.
+ `MEDICAL_CONDITION:`Mendeteksi tanda, gejala, dan diagnosis kondisi medis.
+ `MEDICATION:`Mendeteksi informasi obat dan dosis pada pasien.
+ `PROTECTED_HEALTH_INFORMATION:`Mendeteksi informasi pribadi pasien.
+ `TEST_TREATMENT_PROCEDURE:`Mendeteksi prosedur yang digunakan untuk menentukan kondisi medis.
+ `TIME_EXPRESSION:`Mendeteksi entitas yang terkait dengan waktu ketika mereka dikaitkan dengan entitas yang terdeteksi. 

Semua enam kategori terdeteksi oleh operasi **DetectEntitiesV2**. **Untuk analisis khusus untuk mendeteksi PHI, gunakan **DetectPhi** pada file tunggal dan Start Job untuk analisis batch. PHIDetection** 

 Amazon Comprehend Medical mendeteksi informasi dalam kelas-kelas berikut:
+ *Entitas:* Referensi teks untuk nama objek yang relevan, seperti orang, perawatan, obat-obatan, dan kondisi medis. Misalnya, `ibuprofen`. 
+ *Kategori:* Pengelompokan umum yang dimiliki entitas. Misalnya, ibuprofen adalah bagian dari `MEDICATION` kategori.
+ *Jenis:* Jenis entitas yang terdeteksi dalam satu kategori. Misalnya, ibuprofen termasuk dalam `GENERIC_NAME` tipe dalam `MEDICATION` kategori.
+ *Atribut:* Informasi yang terkait dengan suatu entitas, seperti dosis obat. Misalnya, `200 mg` adalah atribut dari entitas ibuprofen.
+ *Sifat:* Sesuatu yang Amazon Comprehend Medical pahami tentang suatu entitas, berdasarkan konteks. Misalnya, obat memiliki `NEGATION` sifat jika pasien tidak meminumnya.
+ *Tipe Hubungan:* Hubungan antara entitas dan atribut.

Amazon Comprehend Medical memberi Anda lokasi entitas dalam teks input. Di konsol Amazon Comprehend, ini menunjukkan lokasi secara grafis. Saat Anda menggunakan API, ini menunjukkan lokasi dengan offset numerik.

Setiap entitas dan atribut menyertakan skor yang menunjukkan tingkat kepercayaan yang dimiliki Amazon Comprehend Medical dalam keakuratan deteksi. Setiap atribut juga memiliki skor hubungan. Skor menunjukkan tingkat kepercayaan yang dimiliki Amazon Comprehend Medical dalam keakuratan hubungan antara atribut dan entitas induknya. Identifikasi ambang kepercayaan yang sesuai untuk kasus penggunaan Anda. Gunakan ambang kepercayaan tinggi dalam situasi yang membutuhkan akurasi tinggi. Saring data yang tidak memenuhi ambang batas.

## Kategori anatomi
<a name="anatomy-v2"></a>

`ANATOMY`Kategori ini mendeteksi referensi ke bagian-bagian tubuh atau sistem tubuh dan lokasi bagian atau sistem tersebut. 

### Tipe
<a name="anatomy-type-v2"></a>
+ `SYSTEM_ORGAN_SITE`: Sistem tubuh, lokasi atau daerah anatomi, dan situs tubuh.

### Atribut
<a name="anatomy-attribute-v2"></a>
+ `DIRECTION`: Istilah terarah. Misalnya, kiri, kanan, medial, lateral, atas, bawah, posterior, anterior, distal, proksimal, kontralateral, bilateral, ipsilateral, dorsal, ventral, dan sebagainya.

## Kategori kesehatan perilaku, lingkungan, dan sosial
<a name="behavioral-category-v2"></a>

`BEHAVIORAL_ENVIRONMENTAL_SOCIAL`Kategori ini mendeteksi referensi perilaku dan kondisi di lingkungan yang berdampak pada kesehatan seseorang.

### Tipe
<a name="behavioral-type-v2"></a>
+ `ALCOHOL_CONSUMPTION`: Mendefinisikan konsumsi alkohol pasien dalam hal status penggunaan, frekuensi, jumlah, dan durasi.
+ `ALLERGIES`: Mendefinisikan alergi dan respons pasien terhadap alergen.
+ `GENDER`: Identifikasi karakteristik identitas gender.
+ `RACE_ETHNICITY`Konstruksi sosial-politik dari identifikasi pasien dengan kelompok ras dan etnis tertentu.
+ `REC_DRUG_USE`: Mendefinisikan penggunaan obat rekreasi pasien dalam hal status penggunaan, frekuensi, jumlah, dan durasi.
+ `TOBACCO_USE`: Mendefinisikan penggunaan tembakau pasien dalam hal status penggunaan, frekuensi, jumlah, dan durasi.Atribut

Atribut terdeteksi berikut hanya berlaku untuk tipe`ALCOHOL_CONSUMPTION`,`TOBACCO_USE`, dan`REC_DRUG_USE`:
+ `AMOUNT`: Jumlah alkohol, tembakau, atau obat rekreasi yang digunakan.
+ `DURATION`: Berapa lama alkohol, tembakau, atau obat rekreasi telah digunakan.
+ `FREQUENCY`: Seberapa sering alkohol, tembakau, atau obat rekreasi digunakan.

### Sifat-sifat
<a name="behavioral-trait-v2"></a>

Ciri-ciri yang terdeteksi berikut hanya berlaku untuk jenis`ALCOHOL_CONSUMPTION`,`ALLERGIES`,`TOBACCO_USE`, dan`REC_DRUG_USE`:
+ `NEGATION`: Indikasi bahwa hasil atau tindakan negatif atau tidak dilakukan.
+ `PAST_HISTORY`Indikasi bahwa penggunaan alkohol, tembakau, atau obat-obatan rekreasi berasal dari masa lalu pasien (sebelum pertemuan saat ini).

## Kategori kondisi medis
<a name="medical-condition-v2"></a>

`MEDICAL_CONDITION`Kategori ini mendeteksi tanda, gejala, dan diagnosis kondisi medis. Kategori ini memiliki satu tipe entitas, empat atribut, dan empat sifat. Satu atau lebih sifat dapat dikaitkan dengan suatu tipe. Informasi kontekstual tentang atribut dan hubungannya dengan diagnosis terdeteksi dan dipetakan ke `DX_NAME` through `RELATIONSHIP_EXTRACTION.` Misalnya, dari teks “nyeri kronis di kaki kiri”, “kronis” terdeteksi sebagai atribut`ACUITY`, “kiri” terdeteksi sebagai atribut`DIRECTION`, dan “kaki” terdeteksi sebagai atribut. `SYSTEM_ORGAN_SITE` Hubungan masing-masing atribut ini dipetakan ke entitas kondisi medis “nyeri,” bersama dengan skor kepercayaan.

### Tipe
<a name="medical-condition-type-v2"></a>
+ `DX_NAME`: Semua kondisi medis terdaftar. `DX_NAME`Jenis ini termasuk penyakit saat ini, alasan kunjungan, dan riwayat medis.

### Atribut
<a name="medical-condition-attribute-v2"></a>
+ `ACUITY`Penentuan contoh penyakit, seperti kronis, akut, tiba-tiba, persisten, atau bertahap. 
+ `DIRECTION`: Istilah terarah. Misalnya, kiri, kanan, medial, lateral, atas, bawah, posterior, anterior, distal, proksimal, kontralateral, bilateral, ipsilateral, dorsal, atau ventral.
+ `SYSTEM_ORGAN_SITE`: Lokasi anatomi.
+ `QUALITY`Setiap istilah deskriptif dari kondisi medis, seperti tahap atau kelas.

### Sifat-sifat
<a name="medical-condition-trait-v2"></a>
+ `DIAGNOSIS`: Kondisi medis yang ditentukan sebagai penyebab atau akibat dari gejala. Gejala dapat ditemukan melalui temuan fisik, laporan laboratorium atau radiologis, atau cara lain.
+ `HYPOTHETICAL`: Indikasi bahwa suatu kondisi medis dinyatakan sebagai hipotesis.
+ `LOW_CONFIDENCE`: Indikasi bahwa suatu kondisi medis dinyatakan memiliki ketidakpastian yang tinggi. Ini tidak terkait langsung dengan skor kepercayaan yang diberikan.
+ `NEGATION`: Indikasi bahwa hasil atau tindakan negatif atau tidak dilakukan.
+ `PERTAINS_TO_FAMILY`: Indikasi bahwa suatu kondisi medis relevan dengan keluarga pasien, bukan pasien.
+ `SIGN`: Kondisi medis yang dilaporkan dokter.
+ `SYMPTOM`: Kondisi medis yang dilaporkan pasien.

## Kategori obat
<a name="medication-v2"></a>

`MEDICATION`Kategori ini mendeteksi informasi obat dan dosis untuk pasien. Satu atau beberapa atribut dapat diterapkan ke suatu tipe.

### Tipe
<a name="medication-type-v2"></a>
+ `BRAND_NAME`: Nama merek obat atau agen terapeutik yang dilindungi hak cipta.
+ `GENERIC_NAME`: Nama non-merek, nama bahan, atau campuran formula obat atau agen terapeutik.

### Atribut
<a name="medication-attribute-v2"></a>
+ `DOSAGE`: Jumlah obat yang dipesan.
+ `DURATION`: Berapa lama obat harus diberikan.
+ `FORM`: Bentuk obatnya.
+ `FREQUENCY`: Seberapa sering memberikan obat. 
+ `RATE`: Tingkat pemberian obat (terutama untuk infus obat atau IVs).
+ `ROUTE_OR_MODE`: Metode pemberian obat.
+ `STRENGTH`: Kekuatan obat.

### Sifat-sifat
<a name="medication-trait-v2"></a>
+ `NEGATION`: Setiap indikasi bahwa pasien tidak minum obat.
+ `PAST_HISTORY`: Indikasi bahwa obat yang terdeteksi berasal dari masa lalu pasien (sebelum pertemuan saat ini).

## Kategori informasi kesehatan yang dilindungi
<a name="protected-health-information-v2"></a>

`PROTECTED_HEALTH_INFORMATION`Kategori mendeteksi informasi pribadi pasien. Lihat [Mendeteksi PHI](textanalysis-phi.md) untuk mempelajari lebih lanjut tentang operasi ini.

### Tipe
<a name="protected-health-information-types-v2"></a>
+ `ADDRESS`Semua subdivisi geografis dari alamat fasilitas, unit, atau lingkungan apa pun dalam suatu fasilitas.
+ `AGE`: Semua komponen usia, rentang usia, atau usia apa pun yang disebutkan. Ini termasuk pasien, anggota keluarga, atau orang lain. Defaultnya dalam beberapa tahun, kecuali dinyatakan lain.
+ `EMAIL`: Alamat email apa pun.
+ `ID`: Nomor Jaminan Sosial, nomor rekam medis, nomor identifikasi fasilitas, nomor uji klinis, nomor sertifikat atau lisensi, nomor kendaraan atau perangkat, tempat perawatan, atau penyedia. Ini juga termasuk jumlah biometrik pasien, seperti tinggi badan, berat badan, atau nilai laboratorium. 
+ `NAME`: Semua nama. Biasanya, nama pasien, keluarga, atau penyedia.
+ `PHONE_OR_FAX`: Nomor telepon, faks, atau pager apa pun. Tidak termasuk nomor telepon bernama, seperti 1-800-QUIT-NOW dan 911.
+ `PROFESSION`: Setiap profesi atau majikan yang berkaitan dengan pasien atau keluarga pasien. Itu tidak termasuk profesi dokter yang disebutkan dalam catatan. 

## Kategori tes, perawatan, dan prosedur
<a name="test-treatment-procedure-v2"></a>

`TEST_TREATMENT_PROCEDURE`Kategori mendeteksi prosedur yang digunakan untuk menentukan kondisi medis. Satu atau lebih atribut dapat dikaitkan dengan entitas `TEST_NAME` tipe.

### Tipe
<a name="test-treatment-procedure-types-v2"></a>
+ `PROCEDURE_NAME`Intervensi sebagai tindakan satu kali yang dilakukan pada pasien untuk mengobati kondisi medis atau untuk memberikan perawatan pasien.
+ `TEST_NAME`Prosedur yang dilakukan pada pasien untuk diagnostik, pengukuran, skrining, atau penilaian yang mungkin memiliki nilai yang dihasilkan. Ini termasuk prosedur, proses, evaluasi, atau penilaian apa pun untuk menentukan diagnosis, untuk mengesampingkan atau menemukan suatu kondisi, atau untuk mengukur atau menilai pasien.
+ `TREATMENT_NAME`Intervensi dilakukan selama rentang waktu untuk memerangi penyakit atau gangguan. Ini termasuk pengelompokan obat-obatan, seperti antivirus dan vaksinasi.

### Atribut
<a name="test-treatment-procedure-attributes-v2"></a>
+ `TEST_VALUE`: Hasil tes. Hanya berlaku untuk tipe `TEST_NAME` entitas.
+ `TEST_UNIT`: Satuan ukuran yang mungkin menyertai nilai tes. Hanya berlaku untuk tipe `TEST_NAME` entitas.

### Sifat-sifat
<a name="test-treatment-procedure-traits-v2"></a>
+ `FUTURE`Indikasi bahwa tes, perawatan, atau prosedur mengacu pada tindakan atau peristiwa yang akan terjadi setelah subjek catatan.
+ `HYPOTHETICAL`Indikasi bahwa tes, pengobatan, atau prosedur dinyatakan sebagai hipotesis.
+ `NEGATION`: Indikasi bahwa hasil atau tindakan negatif atau tidak dilakukan.
+ `PAST_HISTORY`Indikasi bahwa tes, perawatan, atau prosedur berasal dari masa lalu pasien (sebelum pertemuan saat ini).

## Kategori ekspresi waktu
<a name="time-expression-v2"></a>

`TIME_EXPRESSION`Kategori mendeteksi entitas yang terkait dengan waktu. Ini termasuk entitas seperti tanggal dan ekspresi waktu seperti “tiga hari yang lalu,” “hari ini,” “saat ini,” “hari masuk,” “bulan lalu,” atau “16 hari.” Hasil dalam kategori ini hanya dikembalikan jika dikaitkan dengan entitas. Misalnya, “Kemarin, pasien mengonsumsi 200 mg ibuprofen” akan kembali `Yesterday` sebagai `TIME_EXPRESSION` entitas yang tumpang tindih dengan `GENERIC_NAME` entitas “ibuprofen.” Namun, itu tidak akan diakui sebagai entitas dalam “kemarin, pasien berjalan dengan anjingnya.” 

### Tipe
<a name="time-expression-v2-categories"></a>
+ `TIME_TO_MEDICATION_NAME`: Tanggal obat diminum. Atribut khusus untuk jenis ini adalah `BRAND_NAME` dan`GENERIC_NAME`.
+ `TIME_TO_DX_NAME`: Tanggal kondisi medis terjadi. Atribut untuk tipe ini adalah`DX_NAME`. 
+ `TIME_TO_TEST_NAME`: Tanggal tes dilakukan. Atribut untuk tipe ini adalah`TEST_NAME`.
+ `TIME_TO_PROCEDURE_NAME`: Tanggal prosedur dilakukan. Atribut untuk tipe ini adalah`PROCEDURE_NAME`.
+ `TIME_TO_TREATMENT_NAME`: Tanggal pengobatan diberikan. Atribut untuk tipe ini adalah`TREATMENT_NAME`.

### Jenis hubungan
<a name="time-expression-v2-relationship-type"></a>
+  Hubungan antara entitas dan atribut. Yang diakui `Relationship_type` adalah sebagai berikut: 

  `Overlap`— `TIME_EXPRESSION` Kesepakatan dengan entitas yang terdeteksi.

# Mendeteksi PHI
<a name="textanalysis-phi"></a>

Gunakan operasi **DetectPhi** ketika Anda hanya ingin mendeteksi data Informasi Kesehatan yang Dilindungi (PHI) saat memindai teks klinis. Untuk mendeteksi semua entitas yang tersedia dalam teks klinis gunakan **DetectEntitiesV2**.

API ini paling baik untuk kasus penggunaan di mana hanya mendeteksi entitas PHI yang diperlukan. Untuk informasi tentang informasi dalam kategori non-PHI, lihat. [Mendeteksi entitas (Versi 2)](textanalysis-entitiesv2.md)

**penting**  
 Amazon Comprehend Medical memberikan skor kepercayaan yang menunjukkan tingkat kepercayaan pada keakuratan entitas yang terdeteksi. Evaluasi skor kepercayaan ini dan identifikasi ambang kepercayaan yang tepat untuk kasus penggunaan Anda. Untuk kasus penggunaan kepatuhan tertentu, kami menyarankan Anda menggunakan tinjauan manusia tambahan atau metode lain untuk mengonfirmasi keakuratan PHI yang terdeteksi.

Di bawah undang-undang HIPAA, PHI yang didasarkan pada daftar 18 pengidentifikasi harus diperlakukan dengan hati-hati. Amazon Comprehend Medical mendeteksi entitas yang terkait dengan pengidentifikasi ini tetapi entitas ini tidak memetakan 1:1 ke daftar yang ditentukan oleh metode Safe Harbor. Tidak semua pengidentifikasi terkandung dalam teks klinis yang tidak terstruktur, tetapi Amazon Comprehend Medical mencakup semua pengidentifikasi yang relevan. Pengidentifikasi ini terdiri dari data yang dapat digunakan untuk mengidentifikasi pasien individu, termasuk daftar berikut. Untuk informasi selengkapnya, lihat [Privasi Informasi Kesehatan](https://www.hhs.gov/hipaa/for-professionals/privacy/special-topics/de-identification/index.html) di situs web *Kesehatan dan Layanan Kemanusiaan Pemerintah AS.* 

Setiap entitas terkait Phi menyertakan skor (`Score`dalam respons) yang menunjukkan tingkat kepercayaan yang dimiliki Amazon Comprehend Medical dalam keakuratan deteksi. Identifikasi ambang kepercayaan yang tepat untuk kasus penggunaan Anda dan saring entitas yang tidak memenuhinya. Saat mengidentifikasi kejadian PHI, mungkin lebih baik menggunakan ambang kepercayaan rendah untuk penyaringan guna menangkap lebih banyak entitas potensial yang terdeteksi. Ini terutama benar ketika tidak menggunakan nilai entitas yang terdeteksi dalam kasus penggunaan kepatuhan.

**Entitas terkait Phi berikut dapat dideteksi dengan menjalankan operasi **DetectPhi** atau V2: DetectEntities**


**Entitas PHI yang Terdeteksi**  

|  Entitas  |  Deskripsi  |  Kategori HIPAA  | 
| --- | --- | --- | 
|  USIA  |  Semua komponen usia, rentang usia, dan usia apa pun yang disebutkan, baik itu pasien atau anggota keluarga atau orang lain yang terlibat dalam catatan. Default dalam beberapa tahun kecuali dinyatakan lain.  |  3. Tanggal yang terkait dengan individu  | 
| DATE | Setiap tanggal yang terkait dengan perawatan pasien atau pasien.  | 3. Tanggal yang terkait dengan individu | 
|  NAME  |  Semua nama yang disebutkan dalam catatan klinis, biasanya milik pasien, keluarga, atau penyedia.  |  1. Nama  | 
|  PHONE\$1OR\$1FAX  |  Telepon, faks, pager apa pun; tidak termasuk nomor telepon bernama seperti 1-800-QUIT-NOW serta 911.  |  4. Nomor telepon 5. Nomor FAX  | 
|  Email  |  Alamat email apa pun.  |  6. Alamat email  | 
|  ID  |  Segala jenis nomor yang terkait dengan identitas pasien. Ini termasuk nomor jaminan sosial mereka, nomor rekam medis, nomor identifikasi fasilitas, nomor uji klinis, sertifikat atau nomor lisensi, nomor kendaraan atau perangkat. Ini juga termasuk nomor biometrik, dan angka yang mengidentifikasi tempat perawatan atau penyedia.  |  7. Nomor Jaminan Sosial  8. Nomor Rekam Medis 9. Nomor Rencana Kesehatan 10. Nomor akun 11. Certificate/License angka 12. Pengidentifikasi kendaraan 13. Nomor perangkat 16. Informasi biometrik 18. Karakteristik pengenal lainnya  | 
|  URL  |  URL web apa pun.  |  14. URLs  | 
|  MENEGUR  |  Ini termasuk semua subdivisi geografis dari alamat fasilitas apa pun, fasilitas medis bernama, atau bangsal dalam fasilitas.  |  2. Lokasi geografis  | 
|  PROFESI  |  Termasuk profesi atau majikan yang disebutkan dalam catatan yang berkaitan dengan pasien atau keluarga pasien.  |  18. Karakteristik pengenal lainnya  | 



**Contoh**  


Teks “Pasien adalah John Smith, seorang guru berusia 48 tahun dan penduduk Seattle, Washington.” mengembalikan:
+ “John Smith” sebagai *entitas* tipe `NAME` dalam `PROTECTED_HEALTH_INFORMATION` kategori.
+ “48" sebagai *entitas* tipe `AGE` dalam `PROTECTED_HEALTH_INFORMATION` kategori.
+ “guru” sebagai *entitas* tipe `PROFESSION` (mengidentifikasi karakteristik) dalam `PROTECTED_HEALTH_INFORMATION` kategori.
+ “Seattle, Washington” sebagai `ADDRESS` *entitas* dalam `PROTECTED_HEALTH_INFORMATION` kategori.

Di konsol Amazon Comprehend Medical, ini ditampilkan seperti ini:

![\[Patient information card displaying name, age, profession, and address details.\]](http://docs.aws.amazon.com/id_id/comprehend-medical/latest/dev/images/patient.png)


Saat menggunakan operasi **DetectPhi**, responsnya muncul seperti ini. Saat Anda menggunakan operasi **Start PHIDetection Job**, Amazon Comprehend Medical membuat file di lokasi keluaran dengan struktur ini.

```
{
    "Entities": [
        {
            "Id": 0,
            "BeginOffset": 11,
            "EndOffset": 21,
            "Score": 0.997368335723877,
            "Text": "John Smith",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "NAME",
            "Traits": []
        },
        {
            "Id": 1,
            "BeginOffset": 25,
            "EndOffset": 27,
            "Score": 0.9998362064361572,
            "Text": "48",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "AGE",
            "Traits": []
        },
        {
            "Id": 2,
            "BeginOffset": 37,
            "EndOffset": 44,
            "Score": 0.8661606311798096,
            "Text": "teacher",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "PROFESSION",
            "Traits": []
        },
        {
            "Id": 3,
            "BeginOffset": 61,
            "EndOffset": 68,
            "Score": 0.9629441499710083,
            "Text": "Seattle",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "ADDRESS",
            "Traits": []
        },
        {
            "Id": 4,
            "BeginOffset": 78,
            "EndOffset": 88,
            "Score": 0.38217034935951233,
            "Text": "Washington",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "ADDRESS",
            "Traits": []
        }
    ],
    "UnmappedAttributes": []
}
```

# Batch analisis teks APIs
<a name="textanalysis-batchapi"></a>

Gunakan Amazon Comprehend Medical untuk menganalisis teks medis yang disimpan dalam ember Amazon S3. Analisis hingga 10 GB dokumen dalam satu batch. Anda menggunakan konsol untuk membuat dan mengelola pekerjaan analisis batch, atau menggunakan batch APIs untuk mendeteksi entitas medis, termasuk informasi kesehatan yang dilindungi (PHI). APIs Mulai, hentikan, daftar, dan jelaskan pekerjaan analisis batch yang sedang berlangsung.

 [Informasi harga untuk analisis batch dan operasi Amazon Comprehend Medical lainnya dapat ditemukan di sini.](https://aws.amazon.com/comprehend/medical/pricing/)

## Pemberitahuan penting
<a name="important-notice"></a>

Operasi analisis batch Amazon Comprehend Medical bukanlah pengganti saran medis profesional, diagnosis, atau perawatan. Identifikasi ambang kepercayaan yang tepat untuk kasus penggunaan Anda, dan gunakan ambang kepercayaan tinggi dalam situasi yang membutuhkan akurasi tinggi. Untuk kasus penggunaan tertentu, hasil harus ditinjau dan diverifikasi oleh pengulas manusia yang terlatih dengan tepat. Semua operasi Amazon Comprehend Medical hanya boleh digunakan dalam skenario perawatan pasien setelah ditinjau untuk akurasi dan penilaian medis yang baik oleh profesional medis terlatih.

## Melakukan analisis batch menggunakan APIs
<a name="performing-batch-api"></a>

Anda dapat menjalankan pekerjaan analisis batch menggunakan konsol Amazon Comprehend Medical atau Amazon Comprehend Medical Batch. APIs

**Prasyarat**

 Saat Anda menggunakan Amazon Comprehend Medical API, buat kebijakan AWS Identity Access and Management (IAM) dan lampirkan ke peran IAM. Untuk mempelajari lebih lanjut tentang peran IAM dan kebijakan kepercayaan, lihat Kebijakan [dan Izin IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html). 

****

1. Unggah data Anda ke dalam bucket S3.

1. Untuk memulai pekerjaan analisis baru, gunakan operasi StartEntitiesDetection V2Job atau operasi Start PHIDetection Job. Saat Anda memulai pekerjaan, beri tahu Amazon Comprehend Medical nama bucket input S3 yang berisi file input dan tentukan bucket S3 keluaran untuk menulis file setelah analisis batch.

1. Pantau kemajuan pekerjaan dengan menggunakan konsol atau operasi DescribeEntitiesDetection V2Job atau operasi Deskripsikan PHIDetection Job. Selain itu, ListEntitiesDetection V2Jobs dan List PHIDetection Jobs memungkinkan Anda untuk melihat status semua ontologi yang menghubungkan pekerjaan analisis batch.

1. Jika Anda perlu menghentikan pekerjaan yang sedang berlangsung, gunakan StopEntitiesDetection V2Job atau Stop Job PHIDetection untuk menghentikan analisis.

1. Untuk melihat hasil pekerjaan analisis Anda, lihat bucket S3 keluaran yang Anda konfigurasikan saat memulai pekerjaan.

## Melakukan analisis batch menggunakan konsol
<a name="batch-api-console"></a>

****

1. Unggah data Anda ke dalam bucket S3.

1. Untuk memulai pekerjaan analisis baru, pilih jenis analisis yang akan Anda lakukan. Kemudian berikan nama bucket S3 yang berisi file input dan nama bucket S3 tempat Anda ingin mengirim file output.

1. Pantau status pekerjaan Anda saat sedang berlangsung. Dari konsol, Anda dapat melihat semua operasi analisis batch dan statusnya, termasuk kapan analisis dimulai dan berakhir.

1. Untuk melihat hasil pekerjaan analisis Anda, lihat bucket keluaran S3 yang Anda konfigurasikan saat memulai pekerjaan. 

## Kebijakan IAM untuk operasi batch
<a name="batch-iam"></a>

Peran IAM yang memanggil batch Amazon Comprehend APIs Medical harus memiliki kebijakan yang memberikan akses ke bucket S3 yang berisi file input dan output. Itu juga harus diberi hubungan kepercayaan yang memungkinkan layanan Amazon Comprehend Medical untuk mengambil peran. Untuk mempelajari lebih lanjut tentang peran IAM dan kebijakan kepercayaan, lihat Peran [IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles.html).

Peran harus memiliki kebijakan berikut.

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Action": [
                "s3:GetObject"
            ],
            "Resource": [
                "arn:aws:s3:::input-bucket/*"
            ],
            "Effect": "Allow"
        },
        {
            "Action": [
                "s3:ListBucket"
            ],
            "Resource": [
                "arn:aws:s3:::input-bucket",
                "arn:aws:s3:::output-bucket"
            ],
            "Effect": "Allow"
        },
        {
            "Action": [
                "s3:PutObject"
            ],
            "Resource": [
                "arn:aws:s3:::output-bucket/*"
            ],
            "Effect": "Allow"
        }
    ]
}
```

------

Peran tersebut harus memiliki hubungan kepercayaan berikut. Disarankan agar Anda menggunakan kunci `aws:SourceAccount ` dan `aws:SourceArn` kondisi untuk mencegah masalah keamanan wakil yang membingungkan. Untuk mempelajari lebih lanjut tentang masalah wakil yang bingung dan cara melindungi AWS akun Anda, lihat [Masalah wakil yang bingung](https://docs.aws.amazon.com/IAM/latest/UserGuide/confused-deputy.html) dalam dokumentasi IAM.

------
#### [ JSON ]

****  

```
{
   "Version":"2012-10-17",		 	 	 
   "Statement":[
      {
         "Effect":"Allow",
         "Principal":{
            "Service":[
               "comprehendmedical.amazonaws.com"
            ]
         },
         "Action":"sts:AssumeRole",
         "Condition": {
            "StringEquals": {
               "aws:SourceAccount": "account_id"
            },
            "ArnLike": {
               "aws:SourceArn": "arn:aws:comprehendmedical:us-east-1:account_id:*"
            }
         }
      }
   ]
}
```

------

## File keluaran analisis Batch
<a name="batch-ouput"></a>

Amazon Comprehend Medical membuat satu file output untuk setiap file input dalam batch. File memiliki ekstensi`.out`. Amazon Comprehend Medical pertama-tama membuat direktori di bucket output S3 menggunakan *AwsAccountId* *JobType* - *JobId* - sebagai namanya, dan kemudian menulis semua file output untuk batch ke direktori ini. Amazon Comprehend Medical membuat direktori baru ini sehingga output dari satu pekerjaan tidak menimpa output yang lain.

Output dari operasi batch menghasilkan output yang sama dengan operasi sinkron. Untuk contoh output yang dihasilkan oleh Amazon Comprehend Medical, lihat. [Mendeteksi entitas (Versi 2)](textanalysis-entitiesv2.md)

Setiap operasi batch menghasilkan tiga file manifes yang berisi informasi tentang pekerjaan. 
+ `Manifest`— Meringkas pekerjaan. Memberikan informasi tentang parameter yang digunakan untuk pekerjaan, ukuran total pekerjaan, dan jumlah file yang diproses.
+ `success`— Memberikan informasi tentang file yang berhasil diproses. Termasuk nama file input dan output dan ukuran file input.
+ `unprocessed`— Daftar file yang tidak diproses oleh pekerjaan batch, termasuk kode kesalahan dan pesan kesalahan per file.

Amazon Comprehend Medical menulis file ke direktori output yang Anda tentukan untuk pekerjaan batch. File manifes ringkasan akan ditulis ke folder output, bersama dengan folder berjudul`Manifest_AccountId-Operation-JobId`. Dalam folder manifes adalah `success` folder, yang berisi manifes sukses. Juga termasuk `failed` folder, yang berisi manifes file yang belum diproses. Bagian berikut menunjukkan struktur file manifes.

### File manifes Batch
<a name="batch-manifest"></a>

Berikut ini adalah struktur JSON dari file manifes batch.

```
{"Summary" : 
    {"Status" : "COMPLETED | FAILED | PARTIAL_SUCCESS | STOPPED", 
    "JobType" : "EntitiesDetection | PHIDetection", 
    "InputDataConfiguration" : {
        "Bucket" : "input bucket", 
        "Path" : "path to files/account ID-job type-job ID" 
    }, "OutputDataConfiguration" : {
        "Bucket" : "output bucket", 
        "Path" : "path to files" 
    }, 
    "InputFileCount" : number of files in input bucket, 
    "TotalMeteredCharacters" : total characters processed from all files, 
    "UnprocessedFilesCount" : number of files not processed, 
    "SuccessFilesCount" : total number of files processed, 
    "TotalDurationSeconds" : time required for processing, 
    "SuccessfulFilesListLocation" : "path to file", 
    "UnprocessedFilesListLocation" : "path to file",
    "FailedJobErrorMessage": "error message or if not applicable,
              The status of the job is completed"
    } 
}
```

### File manifes sukses
<a name="batch-success"></a>

Berikut ini adalah struktur JSON dari file yang berisi informasi tentang file yang berhasil diproses.

```
{
        "Files": [{
               "Input": "input path/input file name",
               "Output": "output path/output file name",
               "InputSize": size in bytes of input file
        }, {
               "Input": "input path/input file name",
               "Output": "output path/output file name",
               "InputSize": size in bytes of input file
        }]
}
```

### File manifes yang belum diproses
<a name="batch-unprocessed"></a>

Berikut ini adalah struktur JSON dari file manifes yang berisi informasi tentang file yang belum diproses.

```
{
  "Files" : [ {
      "Input": "file_name_that_failed",
      "ErrorCode": "error code for exception",
      "ErrorMessage": "explanation of the error code and suggestions"
  }, 
  { ...}
  ]
}
```