

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 音声ストリーミングの文字起こし
<a name="streaming"></a>

 Amazon Transcribe ストリーミングを使用すると、メディアコンテンツのリアルタイム文字起こしを生成できます。メディアファイルのアップロードを伴うバッチ文字起こしとは異なり、ストリーミングメディアはリアルタイムで Amazon Transcribe に配信されます。 Amazon Transcribe その後、 はトランスクリプトもリアルタイムで返します。

ストリーミングには、事前に録画されたメディア (映画、音楽、ポッドキャスト) とリアルタイムメディア (ライブニュース放送) が含まれます。の一般的なストリーミングユースケース Amazon Transcribe には、スポーツイベントのライブクローズドキャプションやコールセンターの音声のリアルタイムモニタリングなどがあります。

ストリーミングコンテンツは、 Amazon Transcribe が瞬時に文字起こしした一連の連続したデータパケット、つまり「チャンク」として配信されます。バッチではなくストリーミングを使用する利点には、アプリケーションでのリアルタイムの音声テキスト変換機能や、文字起こしに要する時間の短縮などがあります。ただし、この速度の向上により、場合によっては精度に制限が生じることがあります。

Amazon Transcribe では、ストリーミングに次のオプションが用意されています。
+ [SDK](getting-started-sdk.md) (推奨)
+ [HTTP/2](streaming-setting-up.md#streaming-http2)
+ [WebSocket](streaming-setting-up.md#streaming-websocket)
+ [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/)

でストリーミングオーディオを文字起こしするには AWS マネジメントコンソール、コンピュータのマイクに向かって話します。

**ヒント**  
SDK コードの例については、GitHub の「[AWS サンプルリポジトリ](https://github.com/orgs/aws-samples/repositories?language=&q=transcribe&sort=&type=all)」を参照してください。

ストリーミング文字起こしでサポートされている音声形式は以下のとおりです。
+ FLAC
+ Ogg コンテナ内の OPUS エンコードされた音声
+ PCM (16 ビット符号付き リトルエンディアンの音声形式のみ。WAV は含ま**ない**)

可逆形式 (FLAC または PCM) が推奨されます。

**注記**  
ストリーミング文字起こしは、すべての言語でサポートされているわけではありません。詳細については、[サポートされている言語の表](supported-languages.md)の「データ入力」列を参照してください。

ストリーミング文字起こしの Amazon Transcribe リージョンの可用性を確認するには、[Amazon Transcribe 「エンドポイントとクォータ](https://docs.aws.amazon.com/general/latest/gr/transcribe.html#transcribe_region)」を参照してください。

## ベストプラクティス
<a name="best-practices"></a>

ストリーミング文字起こしの効率を高めるには、以下のことを推奨します。
+ 可能であれば、PCM でエンコードされた音声を使用します。
+ ストリーミングは、できる限りリアルタイムに近いことを確認します。
+ レイテンシーは、音声チャンクのサイズによって異なります。音声タイプ (PCM など) でチャンクサイズを指定できる場合は、各チャンクを 50 ミリ秒から 200 ミリ秒の間で設定します。音声チャンクサイズは次の式で計算できます。

  ```
  chunk_size_in_bytes = chunk_duration_in_millisecond / 1000 * audio_sample_rate * 2
  ```
+ チャンクのサイズを統一します。
+ 音声チャネル数は正しく指定してください。
+ シングルチャネルの PCM 音声では、各サンプルは 2 バイトで構成されるため、各チャンクは偶数のバイトで構成されている必要があります。
+ デュアルチャネル の PCM 音声では、各サンプルは 4 バイトで構成されるため、各チャンクは 4 バイトの倍数である必要があります。
+ 音声ストリームに音声が含まれていない場合は、同じ量の無音部分をエンコードして送信します。たとえば、PCM の無音は 0 バイトのストリームです。
+ 音声には必ず正しいサンプリングレートを指定します。可能であれば、16,000 Hz のサンプリングレートで録音します。これにより、ネットワーク経由で送信される品質とデータ量の最適な妥協点が得られます。ほとんどのハイエンドマイクは 44,100 Hz または 48,000 Hz で録音されます。

## LimitExceededException エラーの処理
<a name="streaming-limit-exceeded"></a>

他の分散システムと同様に、 Amazon Transcribe にはリソースの過剰消費を検出し、それに応じて対応する保護メカニズムがあります。これらのメカニズムのいずれかがトリガーされると、 `LimitExceededException` エラーが発生する可能性があります。このエラーには 3 つの異なる原因があります。

**同時ストリームサービスクォータを超えました**  
これは最も一般的な原因です。これは、同時ストリームサービスクォータを超えたときに発生します。このエラーを解決するには、エクスポネンシャルバックオフで再試行します。この制限に一貫して達した場合は、Service [Service Quotas](https://console.aws.amazon.com/servicequotas/)クォータの引き上げをリクエストします。[AWS サポートセンター](https://console.aws.amazon.com/support/home)に連絡してサポートを依頼することもできます。再試行戦略の詳細については、 SDK およびツールリファレンスガイドの[「再試行動作](https://docs.aws.amazon.com/sdkref/latest/guide/feature-retry-behavior.html)」を参照してください。 *AWS SDKs *

**最大セッション期間を超えました**  
このエラーは、ストリームがセッションの最大許容期間を超えた場合に発生します。これは増やすことのできない厳格な上限です。文字起こしを続行するには、新しいストリーミングセッションを開始します。

**同時ストリームの数が速すぎる**  
これはまれな原因です。これは、ロードテスト中など、同時ストリームの数を急激に増やすと発生する可能性があります。これは、調整可能なクォータを持たないシステムレベルの保護メカニズムです。このエラーを解決するには、エクスポネンシャルバックオフで再試行し、同時ストリームの数を徐々に増やします。再試行戦略の詳細については、 SDK およびツールリファレンスガイドの[「再試行動作](https://docs.aws.amazon.com/sdkref/latest/guide/feature-retry-behavior.html)」を参照してください。 *AWS SDKs * [AWS re:Post](https://repost.aws/) にアクセスするか、[AWS プレミアムサポート](https://aws.amazon.com/premiumsupport/)に連絡することもできます。