Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mentranskripsikan audio streaming
Dengan menggunakan Amazon Transcribe streaming, Anda dapat menghasilkan transkripsi waktu nyata untuk konten media Anda. Tidak seperti transkripsi batch, yang melibatkan pengunggahan file media, media streaming dikirimkan Amazon Transcribe secara real time. Amazon Transcribe kemudian mengembalikan transkrip, juga secara real time.
Streaming dapat mencakup media pra-rekaman (film, musik, dan podcast) dan media real-time (siaran berita langsung). Kasus penggunaan streaming umum Amazon Transcribe termasuk teks tertutup langsung untuk acara olahraga dan pemantauan audio call center secara real-time.
Konten streaming dikirimkan sebagai serangkaian paket data berurutan, atau 'potongan', yang mentranskripsikan secara instan. Amazon Transcribe Keuntungan menggunakan streaming melalui batch termasuk kemampuan ucapan-ke-teks real-time dalam aplikasi Anda dan waktu transkripsi yang lebih cepat. Namun, peningkatan kecepatan ini mungkin memiliki keterbatasan akurasi dalam beberapa kasus.
Amazon Transcribe menawarkan opsi berikut untuk streaming:
-
SDK (lebih disukai)
Untuk mentranskripsikan audio streaming di Konsol Manajemen AWS, bicaralah ke mikrofon komputer Anda.
Tip
Untuk contoh kode SDK, lihat repositori AWS Sampel
Format audio yang didukung untuk transkripsi streaming adalah:
FLAC
OPUS-encoded audio dalam wadah Ogg
PCM (hanya menandatangani format audio 16-bit little-endian, yang tidak termasuk WAV)
Format lossless (FLAC atau PCM) direkomendasikan.
catatan
Transkripsi streaming tidak didukung dengan semua bahasa. Lihat kolom 'Input data' dalam tabel bahasa yang didukung untuk detailnya.
Untuk melihat ketersediaan Amazon Transcribe Wilayah untuk transkripsi streaming, lihat: Amazon Transcribe Titik Akhir dan Kuota.
Praktik terbaik
Rekomendasi berikut meningkatkan efisiensi transkripsi streaming:
-
Jika memungkinkan, gunakan PCM-encoded audio.
-
Pastikan streaming Anda sedekat mungkin dengan waktu nyata.
-
Latensi tergantung pada ukuran potongan audio Anda. Jika Anda dapat menentukan ukuran potongan dengan jenis audio Anda (seperti dengan PCM), atur setiap potongan menjadi antara 50 ms dan 200 ms. Anda dapat menghitung ukuran potongan audio dengan rumus berikut:
chunk_size_in_bytes = chunk_duration_in_millisecond / 1000 * audio_sample_rate * 2 -
Gunakan ukuran potongan yang seragam.
-
Pastikan Anda menentukan jumlah saluran audio dengan benar.
-
Dengan audio PCM saluran tunggal, setiap sampel terdiri dari dua byte, sehingga setiap potongan harus terdiri dari jumlah byte genap.
-
Dengan audio PCM saluran ganda, setiap sampel terdiri dari empat byte, sehingga setiap potongan harus kelipatan 4 byte.
-
Ketika streaming audio Anda tidak berisi ucapan, encode dan kirim jumlah keheningan yang sama. Misalnya, diam untuk PCM adalah aliran nol byte.
-
Pastikan Anda menentukan laju pengambilan sampel yang benar untuk audio Anda. Jika memungkinkan, rekam pada laju pengambilan sampel 16.000 Hz; ini memberikan kompromi terbaik antara kualitas dan volume data yang dikirim melalui jaringan. Perhatikan bahwa sebagian besar mikrofon kelas atas merekam pada 44.100 Hz atau 48.000 Hz.
Menangani LimitExceededException kesalahan
Seperti halnya sistem terdistribusi lainnya, Amazon Transcribe memiliki mekanisme perlindungan yang mendeteksi konsumsi sumber daya yang berlebihan dan bereaksi sesuai dengan itu. LimitExceededExceptionkesalahan dapat terjadi ketika salah satu mekanisme ini dipicu. Ada tiga penyebab berbeda untuk kesalahan ini:
- Kuota layanan streaming bersamaan terlampaui
-
Ini adalah penyebab paling umum. Ini terjadi ketika Anda melebihi kuota layanan streaming bersamaan Anda. Untuk mengatasi kesalahan ini, coba lagi dengan backoff eksponensial. Jika Anda secara konsisten mencapai batas ini, mintalah peningkatan kuota layanan melalui konsol Service Quotas
. Anda juga dapat menghubungi AWS Support Center untuk bantuan. Untuk informasi selengkapnya tentang strategi coba lagi, lihat Perilaku coba lagi di Panduan Referensi AWS SDK dan Alat. - Durasi sesi maksimum terlampaui
-
Kesalahan ini terjadi ketika aliran melebihi durasi sesi maksimum yang diizinkan. Ini adalah batas sulit yang tidak dapat ditingkatkan. Untuk melanjutkan transkrip, mulailah sesi streaming baru.
- Jumlah aliran bersamaan meningkat terlalu cepat
-
Ini adalah penyebab langka. Ini dapat terjadi jika Anda meningkatkan jumlah aliran bersamaan terlalu cepat, misalnya selama tes beban. Ini adalah mekanisme perlindungan tingkat sistem tanpa kuota yang dapat disesuaikan. Untuk mengatasi kesalahan ini, coba lagi dengan backoff eksponensial dan secara bertahap tingkatkan jumlah aliran bersamaan Anda. Untuk informasi selengkapnya tentang strategi coba lagi, lihat Perilaku coba lagi di Panduan Referensi AWS SDK dan Alat. Anda juga dapat mengunjungi AWS re:Post
atau hubungi Premium AWS Support .