

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Kosakata khusus
<a name="custom-vocabulary"></a>

Gunakan kosakata khusus untuk meningkatkan akurasi transkripsi untuk satu atau lebih kata tertentu. Ini umumnya istilah khusus domain, seperti nama merek dan akronim, kata benda yang tepat, dan kata-kata yang tidak ditampilkan dengan benar. Amazon Transcribe 

Kosakata khusus dapat digunakan dengan semua bahasa yang didukung. Perhatikan bahwa hanya karakter yang tercantum dalam [kumpulan karakter](charsets.md) bahasa Anda yang dapat digunakan dalam kosakata khusus.

**penting**  
Anda bertanggung jawab atas integritas data Anda sendiri saat Anda menggunakannya Amazon Transcribe. Jangan memasukkan informasi rahasia, informasi pribadi (PII), atau informasi kesehatan yang dilindungi (PHI) ke dalam kosakata khusus.

Pertimbangan saat membuat kosakata khusus:
+ Anda dapat memiliki hingga 100 file kosakata khusus per Akun AWS
+ Batas ukuran untuk setiap file kosakata kustom adalah 50 Kb
+ Jika menggunakan API untuk membuat kosakata kustom Anda, file kosakata Anda harus dalam format teks (\$1.txt). Jika menggunakan Konsol Manajemen AWS, file kosakata Anda dapat dalam format teks (\$1.txt) atau format nilai dipisahkan koma (\$1.csv).
+ Setiap entri dalam kosakata kustom tidak boleh melebihi 256 karakter
+ Untuk menggunakan kosakata khusus, itu harus dibuat Wilayah AWS sama dengan transkripsi Anda.

**Tip**  
Anda dapat menguji kosakata khusus Anda menggunakan. Konsol Manajemen AWS Setelah kosakata kustom Anda siap digunakan, masuk ke, pilih **Transkripsi waktu nyata Konsol Manajemen AWS**, gulir ke **Kustomisasi**, aktifkan kosakata khusus, dan pilih **kosakata khusus** Anda dari daftar tarik-turun. Kemudian pilih **mulai streaming**. Ucapkan beberapa kata dalam kosakata khusus Anda ke mikrofon Anda untuk melihat apakah kata-kata tersebut ditampilkan dengan benar.

## Tabel kosakata khusus versus daftar
<a name="custom-vocabulary-tables-lists"></a>

**penting**  
Kosakata kustom dalam format daftar tidak digunakan lagi. Jika Anda membuat kosakata kustom baru, gunakan format [tabel](custom-vocabulary-create-table.md).

Tabel memberi Anda lebih banyak pilihan untuk — dan lebih banyak kontrol atas — input dan output kata dalam kosakata khusus Anda. Dengan tabel, Anda harus menentukan beberapa kategori (Phrase and DisplayAs), memungkinkan Anda untuk menyempurnakan output Anda.

Daftar tidak memiliki opsi tambahan, jadi Anda hanya dapat mengetikkan entri seperti yang Anda inginkan untuk muncul di transkrip Anda, menggantikan semua spasi dengan tanda hubung.

The Konsol Manajemen AWS, AWS CLI, dan AWS SDKs semua menggunakan tabel kosakata kustom dengan cara yang sama; daftar digunakan secara berbeda untuk setiap metode dan dengan demikian mungkin memerlukan pemformatan tambahan untuk keberhasilan penggunaan antar metode.

Untuk informasi selengkapnya, silakan lihat [Membuat kosakata khusus menggunakan tabel](custom-vocabulary-create-table.md) dan [Membuat kosakata khusus menggunakan daftar](custom-vocabulary-create-list.md).

Untuk menyelam lebih dalam dan mempelajari cara menggunakan Amazon Augmented AI dengan kosakata khusus, lihat:

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/65eVesNiJzY/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/65eVesNiJzY)


**Operasi API khusus untuk kosakata khusus**  
 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DeleteVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DeleteVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ListVocabularies.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ListVocabularies.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_UpdateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_UpdateVocabulary.html) 

# Membuat kosakata khusus menggunakan tabel
<a name="custom-vocabulary-create-table"></a>

Menggunakan format tabel adalah cara yang lebih disukai untuk membuat kosakata kustom Anda. Tabel kosakata harus terdiri dari empat kolom (Phrase, SoundsLike, IPA, and DisplayAs), yang dapat dimasukkan dalam urutan apa pun:


| Frase | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
|  Wajib. Setiap baris dalam tabel Anda harus berisi entri di kolom ini. Jangan gunakan spasi di kolom ini. Jika entri Anda berisi beberapa kata, pisahkan setiap kata dengan tanda hubung (-). Misalnya, **Andorra-la-Vella** atau **Los-Angeles**. Untuk akronim, setiap huruf yang diucapkan harus dipisahkan oleh titik. Periode trailing juga perlu diucapkan. Jika akronim Anda jamak, Anda harus menggunakan tanda hubung antara akronim dan 's'. Misalnya, 'CLI' adalah **C.L.I.** (tidak**C.L.I**) dan 'ABCs' adalah **A.B.C.-s** (tidak**A.B.C-s**). Jika frasa Anda terdiri dari kata dan akronim, kedua komponen ini harus dipisahkan oleh tanda hubung. Misalnya, 'DynamoDB' adalah. **Dynamo-D.B.** Jangan sertakan digit di kolom ini; angka harus dijabarkan. Misalnya, 'VX02Q' adalah. **V.X.-zero-two-Q.**  |  `SoundsLike`tidak lagi didukung untuk Kosakata Kustom. Silakan biarkan kolom kosong. Nilai apa pun di kolom ini akan diabaikan. Kami akan menghapus dukungan untuk kolom ini di masa mendatang.  |  `IPA`tidak lagi didukung untuk Kosakata Kustom. Silakan biarkan kolom kosong. Nilai apa pun di kolom ini akan diabaikan. Kami akan menghapus dukungan untuk kolom ini di masa mendatang.  |  Tidak wajib. Baris di kolom ini dapat dibiarkan kosong. Anda dapat menggunakan spasi di kolom ini. Mendefinisikan bagaimana Anda ingin entri Anda terlihat dalam output transkripsi Anda. Misalnya, **Andorra-la-Vella** di `Phrase` kolom ada **Andorra la Vella** di `DisplayAs` kolom. Jika baris di kolom ini kosong, Amazon Transcribe gunakan isi `Phrase` kolom untuk menentukan output. Anda dapat menyertakan digit (`0-9`) di kolom ini.  | 

Hal-hal yang perlu diperhatikan saat membuat tabel Anda:
+ Tabel Anda harus berisi keempat header kolom (Phrase, SoundsLike, IPA, and DisplayAs). `Phrase`Kolom harus berisi entri pada setiap baris. Kemampuan untuk memberikan input pengucapan melalui `IPA` dan `SoundsLike` tidak lagi didukung dan Anda dapat membiarkan kolom kosong. Nilai apa pun di kolom ini akan diabaikan.
+ Setiap kolom harus TAB atau koma (,) digambarkan; ini berlaku untuk setiap baris dalam file kosakata kustom Anda. Jika baris berisi kolom kosong, Anda masih harus menyertakan delineator (TAB atau koma) untuk setiap kolom.
+ Spasi hanya diperbolehkan di dalam `DisplayAs` kolom `IPA` dan. Jangan gunakan spasi untuk memisahkan kolom.
+ `IPA`dan `SoundsLike` tidak lagi didukung untuk Kosakata Kustom. Silakan biarkan kolom kosong. Nilai apa pun di kolom ini akan diabaikan. Kami akan menghapus dukungan untuk kolom ini di masa mendatang.
+ `DisplayAs`Kolom mendukung simbol dan karakter khusus (misalnya, C \$1\$1). Semua kolom lain mendukung karakter yang tercantum di halaman [set karakter](charsets.md) bahasa Anda.
+ Jika Anda ingin memasukkan angka di `Phrase` kolom, Anda harus mengejanya. Digit (`0-9`) hanya didukung di `DisplayAs` kolom.
+ Anda harus menyimpan tabel Anda sebagai file plaintext (\$1.txt) dalam format. `LF` Jika Anda menggunakan format lain, seperti`CRLF`, kosakata kustom Anda tidak dapat diproses.
+ Anda harus mengunggah file kosakata khusus Anda ke dalam Amazon S3 ember dan memprosesnya [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html)sebelum Anda dapat memasukkannya ke dalam permintaan transkripsi. Lihat [Membuat tabel kosakata khusus](#custom-vocabulary-create-table-examples) untuk instruksi.

**catatan**  
Masukkan akronim, atau kata lain yang hurufnya harus diucapkan satu per satu, sebagai huruf tunggal yang dipisahkan oleh titik (**A.B.C.**). Untuk memasukkan bentuk jamak akronim, seperti '', pisahkan ABCs 's' dari akronim dengan tanda hubung (). **A.B.C.-s** Anda dapat menggunakan huruf besar atau kecil untuk mendefinisikan akronim. Akronim tidak didukung dalam semua bahasa; lihat. [Bahasa yang didukung dan fitur khusus bahasa](supported-languages.md)

Berikut adalah contoh tabel kosakata kustom (di mana **[TAB]** mewakili karakter tab):

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
Los-Angeles[TAB][TAB][TAB]Los Angeles
Eva-Maria[TAB][TAB][TAB]
A.B.C.-s[TAB][TAB][TAB]ABCs
Amazon-dot-com[TAB][TAB][TAB]Amazon.com
C.L.I.[TAB][TAB][TAB]CLI
Andorra-la-Vella[TAB][TAB][TAB]Andorra la Vella
Dynamo-D.B.[TAB][TAB][TAB]DynamoDB
V.X.-zero-two[TAB][TAB][TAB]VX02
V.X.-zero-two-Q.[TAB][TAB][TAB]VX02Q
```

Untuk kejernihan visual, berikut adalah tabel yang sama dengan kolom sejajar. **Jangan** menambahkan spasi antar kolom dalam tabel kosakata kustom Anda; tabel Anda akan terlihat tidak sejajar seperti contoh sebelumnya.

```
Phrase          [TAB]SoundsLike          [TAB]IPA                [TAB]DisplayAs  
Los-Angeles     [TAB]                    [TAB]                   [TAB]Los Angeles   
Eva-Maria       [TAB]                    [TAB]                   [TAB]
A.B.C.-s        [TAB]                    [TAB]                   [TAB]ABCs  
amazon-dot-com  [TAB]                    [TAB]                   [TAB]amazon.com
C.L.I.          [TAB]                    [TAB]                   [TAB]CLI   
Andorra-la-Vella[TAB]                    [TAB]                   [TAB]Andorra la Vella
Dynamo-D.B.     [TAB]                    [TAB]                   [TAB]DynamoDB
V.X.-zero-two   [TAB]                    [TAB]                   [TAB]VX02
V.X.-zero-two-Q.[TAB]                    [TAB]                   [TAB]VX02Q
```

## Membuat tabel kosakata khusus
<a name="custom-vocabulary-create-table-examples"></a>

Untuk memproses tabel kosakata khusus untuk digunakan Amazon Transcribe, lihat contoh berikut:

### Konsol Manajemen AWS
<a name="vocab-create-table-console"></a>

1. Masuk ke [Konsol Manajemen AWS](https://console.aws.amazon.com/transcribe/).

1. Di panel navigasi, pilih **Kosakata khusus**. Ini membuka halaman **kosakata kustom** di mana Anda dapat melihat kosakata yang ada atau membuat yang baru.

1. Pilih **Buat kosakata**.  
![\[Amazon Transcribe tangkapan layar konsol: halaman 'kosakata kustom'.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/vocab-create-console.png)

   Ini membawa Anda ke halaman **Buat kosakata.** Masukkan nama untuk kosakata kustom baru Anda.

   Di sini, Anda memiliki tiga opsi:

   1. Unggah file txt atau csv dari komputer Anda.

      Anda dapat membuat kosakata khusus dari awal atau mengunduh templat untuk membantu Anda memulai. Kosakata Anda kemudian diisi otomatis di panel **Lihat dan** edit kosakata.  
![\[Amazon Transcribe tangkapan layar konsol: halaman 'buat dan impor kosakata'.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/vocab-create-console-upload.png)

   1. Impor file txt atau csv dari suatu lokasi. Amazon S3 

      Anda dapat membuat kosakata khusus dari awal atau mengunduh templat untuk membantu Anda memulai. Unggah file kosakata Anda yang sudah selesai ke Amazon S3 bucket dan tentukan URI dalam permintaan Anda. Kosakata Anda kemudian diisi otomatis di panel **Lihat dan** edit kosakata.  
![\[Amazon Transcribe tangkapan layar konsol: halaman 'buat dan impor kosakata'.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/vocab-create-console-s3.png)

   1. Buat kosakata Anda secara manual di konsol.

      Gulir ke panel **Lihat dan edit kosakata** dan pilih **Tambahkan** 10 baris. Anda sekarang dapat memasukkan istilah secara manual.  
![\[Amazon Transcribe tangkapan layar konsol: halaman 'buat dan impor kosakata'.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/vocab-create-console-manual.png)

1. Anda dapat mengedit kosakata Anda **Lihat dan mengedit panel kosakata**. Untuk membuat perubahan, klik pada entri yang ingin Anda modifikasi.  
![\[Amazon Transcribe tangkapan layar konsol: panel 'buat dan edit kosakata'.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/vocab-create-edit2.png)

   Jika Anda membuat kesalahan, Anda mendapatkan pesan kesalahan terperinci sehingga Anda dapat memperbaiki masalah apa pun sebelum memproses kosakata Anda. Perhatikan bahwa jika Anda tidak memperbaiki semua kesalahan sebelum memilih **Buat kosakata, permintaan kosakata** Anda gagal.  
![\[Amazon Transcribe tangkapan layar konsol: panel 'buat dan edit kosakata'.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/vocab-create-edit3.png)

   Pilih tanda centang (✓) untuk menyimpan perubahan Anda atau 'X' untuk membuang perubahan Anda.

1. Secara opsional, tambahkan tag ke kosakata kustom Anda. Setelah semua bidang selesai dan puas dengan kosakata Anda, pilih **Buat kosakata** di bagian bawah halaman. Ini membawa Anda kembali ke halaman **kosakata Kustom** di mana Anda dapat melihat status kosakata kustom Anda. Ketika status berubah dari 'Tertunda' menjadi 'Siap' kosakata kustom Anda dapat digunakan dengan transkripsi.  
![\[Amazon Transcribe tangkapan layar konsol: kosakata khusus dalam status tertunda saat memproses.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/vocab-create-console-pending.png)

1. Jika status berubah menjadi 'Gagal', pilih nama kosakata khusus Anda untuk membuka halaman informasinya.  
![\[Amazon Transcribe tangkapan layar konsol: halaman 'kosakata kustom' yang menampilkan satu kosakata sebagai lengkap dan satu lagi gagal.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/vocab-create-console-failed.png)

   Ada spanduk **alasan kegagalan** di bagian atas halaman ini yang memberikan informasi tentang mengapa kosakata kustom Anda gagal. Perbaiki kesalahan dalam file teks Anda dan coba lagi.  
![\[Amazon Transcribe tangkapan layar konsol: halaman informasi kosakata menunjukkan alasan kegagalan.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/vocab-create-console-failed2.png)

### AWS CLI
<a name="vocab-create-table-cli"></a>

Contoh ini menggunakan perintah [create-vocabulary dengan file kosakata](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html) yang diformat tabel. Untuk informasi selengkapnya, lihat [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

Untuk menggunakan kosakata kustom yang ada dalam pekerjaan transkripsi, atur `VocabularyName` di [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html)bidang saat Anda memanggil [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)operasi atau, dari Konsol Manajemen AWS, pilih kosakata khusus dari daftar tarik-turun.

```
aws transcribe create-vocabulary \ 
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US
```

Berikut contoh lain menggunakan perintah [create-vocabulary](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html), dan badan permintaan yang membuat kosakata kustom Anda.

```
aws transcribe create-vocabulary \
--cli-input-json file://filepath/my-first-vocab-table.json
```

File *my-first-vocab-table.json* berisi badan permintaan berikut.

```
{
  "VocabularyName": "my-first-vocabulary",
  "VocabularyFileUri": "s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt",
  "LanguageCode": "en-US"
}
```

Setelah `VocabularyState` berubah dari `PENDING` ke`READY`, kosakata khusus Anda siap digunakan dengan transkripsi. Untuk melihat status kosakata kustom Anda saat ini, jalankan:

```
aws transcribe get-vocabulary \
--vocabulary-name my-first-vocabulary
```

### AWS SDK untuk Python (Boto3)
<a name="vocab-create-table-python-batch"></a>

Contoh ini menggunakan AWS SDK untuk Python (Boto3) untuk membuat kosakata kustom dari tabel menggunakan metode [create\$1vocabulary](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary). Untuk informasi selengkapnya, lihat [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

Untuk menggunakan kosakata kustom yang ada dalam pekerjaan transkripsi, atur `VocabularyName` di [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html)bidang saat Anda memanggil [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)operasi atau, dari Konsol Manajemen AWS, pilih kosakata khusus dari daftar tarik-turun.

Untuk contoh tambahan menggunakan AWS SDKs, termasuk contoh khusus fitur, skenario, dan lintas layanan, lihat bagian ini. [Contoh kode untuk Amazon Transcribe menggunakan AWS SDKs](service_code_examples.md)

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_vocabulary(
    LanguageCode = 'en-US',
    VocabularyName = vocab_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
)

while True:
    status = transcribe.get_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**catatan**  
Jika Anda membuat Amazon S3 bucket baru untuk file kosakata kustom Anda, pastikan IAM peran yang membuat [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html)permintaan memiliki izin untuk mengakses bucket ini. Jika peran tidak memiliki izin yang benar, permintaan Anda gagal. Anda dapat secara opsional menentukan IAM peran dalam permintaan Anda dengan menyertakan `DataAccessRoleArn` parameter. Untuk informasi selengkapnya tentang IAM peran dan kebijakan di Amazon Transcribe, lihat[Amazon Transcribe contoh kebijakan berbasis identitas](security_iam_id-based-policy-examples.md).

# Membuat kosakata khusus menggunakan daftar
<a name="custom-vocabulary-create-list"></a>

**penting**  
[Kosakata kustom dalam format daftar tidak digunakan lagi, jadi jika Anda membuat kosakata kustom baru, kami sangat menyarankan menggunakan format tabel.](custom-vocabulary-create-table.md)

Anda dapat membuat kosakata kustom dari daftar menggunakan Konsol Manajemen AWS, AWS CLI, atau. AWS SDKs
+ **Konsol Manajemen AWS**: Anda harus membuat dan mengunggah file teks yang berisi kosakata khusus Anda. Anda dapat menggunakan entri yang dipisahkan baris atau dipisahkan koma. Perhatikan bahwa daftar Anda harus disimpan sebagai file teks (\$1.txt) dalam format. `LF` Jika Anda menggunakan format lain, seperti`CRLF`, kosakata khusus Anda tidak diterima oleh. Amazon Transcribe
+ **AWS CLI**dan **AWS SDKs**: Anda harus menyertakan kosakata kustom Anda sebagai entri yang dipisahkan koma dalam panggilan API Anda menggunakan bendera. [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html#transcribe-CreateVocabulary-request-Phrases](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html#transcribe-CreateVocabulary-request-Phrases)

Jika entri berisi beberapa kata, Anda harus memberi tanda hubung setiap kata. Misalnya, Anda memasukkan 'Los Angeles' sebagai **Los-Angeles** dan 'Andorra la Vella' sebagai. **Andorra-la-Vella**

Berikut adalah contoh dari dua format daftar yang valid. Lihat [Membuat daftar kosakata khusus](#custom-vocabulary-create-list-examples) contoh khusus metode.
+ Entri yang dipisahkan koma:

  ```
  Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  ```
+ Entri yang dipisahkan baris:

  ```
  Los-Angeles
  CLI
  Eva-Maria
  ABCs
  Andorra-la-Vella
  ```

**penting**  
Anda hanya dapat menggunakan karakter yang didukung untuk bahasa Anda. Lihat [set karakter](charsets.md) bahasa Anda untuk detailnya.

Daftar kosakata khusus tidak didukung dengan operasi. [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html) Jika membuat kosakata medis khusus, Anda harus menggunakan format tabel; lihat [Membuat kosakata khusus menggunakan tabel](custom-vocabulary-create-table.md) untuk instruksi.

## Membuat daftar kosakata khusus
<a name="custom-vocabulary-create-list-examples"></a>

Untuk memproses daftar kosakata khusus untuk digunakan Amazon Transcribe, lihat contoh berikut:

### AWS CLI
<a name="vocab-create-list-cli"></a>

Contoh ini menggunakan perintah [create-vocabulary dengan file kosakata](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html) kustom yang diformat daftar. Untuk informasi selengkapnya, lihat [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

```
aws transcribe create-vocabulary \ 
--vocabulary-name my-first-vocabulary \ 
--language-code en-US \ 
--phrases {CLI,Eva-Maria,ABCs}
```

Berikut contoh lain menggunakan perintah [create-vocabulary](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html), dan badan permintaan yang membuat kosakata kustom Anda.

```
aws transcribe create-vocabulary \
--cli-input-json file://filepath/my-first-vocab-list.json
```

File *my-first-vocab-list.json* berisi badan permintaan berikut.

```
{
  "VocabularyName": "my-first-vocabulary",
  "LanguageCode": "en-US",
  "Phrases": [
        "CLI","Eva-Maria","ABCs"
  ]
}
```

Setelah `VocabularyState` berubah dari `PENDING` ke`READY`, kosakata khusus Anda siap digunakan dengan transkripsi. Untuk melihat status kosakata kustom Anda saat ini, jalankan:

```
aws transcribe get-vocabulary \
--vocabulary-name my-first-vocabulary
```

### AWS SDK untuk Python (Boto3)
<a name="vocab-create-list-python-batch"></a>

Contoh ini menggunakan AWS SDK untuk Python (Boto3) untuk membuat kosakata kustom dari daftar menggunakan metode [create\$1vocabulary](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary). Untuk informasi selengkapnya, lihat [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

Untuk contoh tambahan menggunakan AWS SDKs, termasuk contoh khusus fitur, skenario, dan lintas layanan, lihat bagian ini. [Contoh kode untuk Amazon Transcribe menggunakan AWS SDKs](service_code_examples.md)

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_vocabulary(
    LanguageCode = 'en-US',
    VocabularyName = vocab_name,
    Phrases = [
        'CLI','Eva-Maria','ABCs'
    ]
)

while True:
    status = transcribe.get_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**catatan**  
Jika Anda membuat Amazon S3 bucket baru untuk file kosakata kustom Anda, pastikan IAM peran yang membuat [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html)permintaan memiliki izin untuk mengakses bucket ini. Jika peran tidak memiliki izin yang benar, permintaan Anda gagal. Anda dapat secara opsional menentukan IAM peran dalam permintaan Anda dengan menyertakan `DataAccessRoleArn` parameter. Untuk informasi selengkapnya tentang IAM peran dan kebijakan di Amazon Transcribe, lihat[Amazon Transcribe contoh kebijakan berbasis identitas](security_iam_id-based-policy-examples.md).

# Menggunakan kosakata khusus
<a name="custom-vocabulary-using"></a>

Setelah kosakata kustom Anda dibuat, Anda dapat memasukkannya ke dalam permintaan transkripsi Anda; lihat bagian berikut untuk contoh.

Bahasa kosakata kustom yang Anda sertakan dalam permintaan Anda harus cocok dengan kode bahasa yang Anda tentukan untuk media Anda. Jika bahasa tidak cocok, kosakata khusus Anda tidak diterapkan pada transkripsi Anda dan tidak ada peringatan atau kesalahan.

## Menggunakan kosakata khusus dalam transkripsi batch
<a name="custom-vocabulary-using-batch"></a>

Untuk menggunakan kosakata khusus dengan transkripsi batch, lihat contoh berikut ini:

### Konsol Manajemen AWS
<a name="vocab-using-console-batch"></a>

1. Masuk ke [Konsol Manajemen AWS](https://console.aws.amazon.com/transcribe/).

1. Di panel navigasi, pilih **Pekerjaan transkripsi**, lalu pilih **Buat pekerjaan** (kanan atas). Ini membuka halaman **Tentukan detail pekerjaan**.  
![\[Amazon Transcribe tangkapan layar konsol: halaman 'tentukan detail pekerjaan'.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/console-batch-job-details-1.png)

   Beri nama pekerjaan Anda dan tentukan media input Anda. Secara opsional sertakan bidang lain, lalu pilih **Berikutnya**.

1. Di bagian bawah halaman **Configure job**, di panel **Kustomisasi**, aktifkan kosakata **kustom**.  
![\[Amazon Transcribe tangkapan layar konsol: halaman 'konfigurasi pekerjaan'.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/console-batch-configure-job-vocab.png)

1. Pilih kosakata kustom Anda dari menu dropdown.

   Pilih **Buat pekerjaan** untuk menjalankan pekerjaan transkripsi Anda. 

### AWS CLI
<a name="vocab-using-cli"></a>

Contoh ini menggunakan [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)perintah dan `Settings` parameter dengan `VocabularyName` sub-parameter. Untuk informasi selengkapnya, silakan lihat [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) dan [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html).

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings VocabularyName=my-first-vocabulary
```

Berikut contoh lain menggunakan [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)perintah, dan badan permintaan yang menyertakan kosakata kustom Anda dengan pekerjaan itu.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://my-first-vocabulary-job.json
```

File *my-first-vocabulary-job.json* berisi badan permintaan berikut.

```
{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "VocabularyName": "my-first-vocabulary"
   }
}
```

### AWS SDK untuk Python (Boto3)
<a name="vocab-using-python-batch"></a>

Contoh ini menggunakan AWS SDK untuk Python (Boto3) untuk menyertakan kosakata khusus menggunakan `Settings` argumen untuk metode [start\$1transcription\$1job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job). Untuk informasi selengkapnya, silakan lihat [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) dan [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html).

Untuk contoh tambahan menggunakan AWS SDKs, termasuk contoh khusus fitur, skenario, dan lintas layanan, lihat bagian ini. [Contoh kode untuk Amazon Transcribe menggunakan AWS SDKs](service_code_examples.md)

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'VocabularyName': 'my-first-vocabulary' 
   }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## Menggunakan kosakata khusus dalam transkripsi streaming
<a name="custom-vocabulary-using-stream"></a>

Untuk menggunakan kosakata khusus dengan transkripsi streaming, lihat contoh berikut ini:

### Konsol Manajemen AWS
<a name="vocab-using-console-stream"></a>

1. Masuk ke [Konsol Manajemen AWS](https://console.aws.amazon.com/transcribe/).

1. Di panel navigasi, pilih **Transkripsi waktu nyata**. Gulir ke bawah ke **Kustomisasi** dan perluas bidang ini jika diminimalkan.  
![\[Amazon Transcribe tangkapan layar konsol: halaman 'transkripsi waktu-nyata'.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/stream-main.png)

1. Aktifkan kosakata **kustom dan pilih kosakata** kustom dari menu tarik-turun.  
![\[Amazon Transcribe tangkapan layar konsol: panel 'penyesuaian' yang diperluas.\]](http://docs.aws.amazon.com/id_id/transcribe/latest/dg/images/vocab-stream2.png)

   Sertakan pengaturan lain yang ingin Anda terapkan ke streaming Anda.

1. Anda sekarang siap untuk mentranskripsikan aliran Anda. Pilih **Mulai streaming** dan mulai berbicara. Untuk mengakhiri dikte Anda, pilih **Hentikan streaming**.

### Aliran HTTP/2
<a name="vocab-using-http2"></a>

Contoh ini membuat permintaan HTTP/2 yang menyertakan kosakata kustom Anda. Untuk informasi lebih lanjut tentang menggunakan streaming HTTP/2 dengan Amazon Transcribe, lihat. [Menyiapkan aliran HTTP/2](streaming-setting-up.md#streaming-http2) Untuk detail selengkapnya tentang parameter dan header khusus untuk Amazon Transcribe, lihat [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-transcribe-vocabulary-name: my-first-vocabulary
transfer-encoding: chunked
```

Definisi parameter dapat ditemukan di [Referensi API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html); parameter yang umum untuk semua operasi AWS API tercantum di bagian [Parameter Umum](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

### WebSocket aliran
<a name="vocab-using-websocket"></a>

Contoh ini membuat URL presigned yang menerapkan kosakata kustom Anda ke stream. WebSocket Jeda baris telah ditambahkan untuk keterbacaan. Untuk informasi selengkapnya tentang penggunaan WebSocket stream dengan Amazon Transcribe, lihat[Menyiapkan WebSocket aliran](streaming-setting-up.md#streaming-websocket). Untuk detail lebih lanjut tentang parameter, lihat [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&media-encoding=flac
&sample-rate=16000    
&vocabulary-name=my-first-vocabulary
```

Definisi parameter dapat ditemukan di [Referensi API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html); parameter yang umum untuk semua operasi AWS API tercantum di bagian [Parameter Umum](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).