

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# ストリーミング文字起こしによる言語識別
<a name="lang-id-stream"></a>

ストリーミング言語識別は、メディアストリームで話されている主要言語を識別できます。 では、言語を識別するために少なくとも 1 秒の音声 Amazon Transcribe が必要です。

ストリームに 1 つの言語しか含まれていない場合は、単一言語識別を有効にできます。これにより、メディアファイルで使用されている主要言語が識別され、この言語のみを使用してトランスクリプトが作成されます。

ストリームに複数の言語が含まれている場合は、多言語識別を有効にできます。これにより、ストリームで使用されているすべての言語を識別し、識別された各言語を使用してトランスクリプトを作成できます。多言語のトランスクリプトが作成されることに注意してください。トランスクリプトの翻訳など Amazon Transcribe、他の サービスを使用できます。

ストリーミング言語識別には,少なくとも 2 つの言語コードを指定する必要があります。また、ストリームごとに、1 つの言語に対して 1 つの言語方言しか選択できません。つまり、`en-US` と `en-AU` を同じ文字起こしの言語オプションとして選択することはできません。

また、指定した言語コードの一覧から優先言語を選択するオプションもあります。優先言語を追加すると、言語識別プロセスが速くなるため、短い音声クリップの場合に便利です。

**重要**  
指定した言語コードが音声で識別される言語と一致しない場合、 Amazon Transcribe は指定した言語コードから最も近い言語を選択します。次に、その言語の文字起こしが作成されます。たとえば、メディアが米国英語 (`en-US`) で、 Amazon Transcribe 言語コード `zh-CN`、`fr-FR`、および を指定した場合`de-DE`、 Amazon Transcribe はメディアをドイツ語 (`de-DE`) に一致させ、ドイツ語の文字起こしを生成する可能性があります。言語コードと話し言葉が一致しないと、文字起こしが不正確になる可能性があるため、言語コードを含める際には注意が必要です。

メディアに 2 つのチャネルが含まれている場合、 Amazon Transcribe は各チャネルで話されている主要言語を識別できます。この場合は、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html#transcribe-Type-Settings-ChannelIdentification](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html#transcribe-Type-Settings-ChannelIdentification) パラメータを `true` に設定することで各チャネルが別々に文字起こしされます。このパラメータのデフォルトは `false` です。変更しない場合は、最初のチャネルだけが文字起こしされ、1 つの言語だけが識別されます。

ストリーミング言語識別は、カスタム言語モデルやリダクションと組み合わせることはできません。言語識別を他の機能と組み合わせる場合、それらの機能でサポートされている言語、およびストリーミング文字起こしでサポートされている言語に制限されます。「[サポートされている言語](supported-languages.md)」を参照してください。

**注記**  
PCM と FLAC は、ストリーミング言語識別でサポートされる唯一の音声形式です。多言語識別では、PCM のみがサポートされています。

## 多言語音声の言語識別
<a name="multi-language-streaming"></a>

多言語識別は、多言語のストリームを対象としており、ストリーム内のすべてのサポートされている言語を反映したトランスクリプトを提供します。つまり、会話の途中でスピーカーが言語を変更したり、各参加者が異なる言語を話したりしても、文字起こし出力は各言語を正しく検出して文字起こしします。

例えば、ストリームに米国英語 (`en-US`) とヒンディー語 (`hi-IN`) を交互に話すバイリンガルの話者がいる場合、多言語識別により、米国英語を `en-US` とし、ヒンディー語を `hi-IN` として識別して書き起こすことができます。これは、1 つの主要言語だけ使ってトランスクリプトを作成する単一言語識別とは異なります。この場合、主要言語ではない話し言葉はすべて正しく文字起こしされません。

**注記**  
現在、リダクションとカスタム言語モデルは多言語識別ではサポートされていません。

## ストリーミングメディアでの言語識別を使用
<a name="lang-id-stream-examples"></a>

バッチ文字起こしジョブで **AWS マネジメントコンソール**、**HTTP/2**、または **WebSocket** を使用して、自動言語識別を使用できます: 例については、次を参照してください。

### AWS マネジメントコンソール
<a name="lang-id-console-stream"></a>

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインで、[**リアルタイム文字起こし**] を選択します。**言語設定**にスクロールして、最小化されている場合はこのフィールドを展開します。  
![\[Amazon Transcribe コンソールのスクリーンショット: 「リアルタイム文字起こし」ページの折りたたまれた「言語設定」タブ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/lang-id-stream1.png)

1. **[自動言語識別]** または **[複数言語の自動識別]** を選択します。  
![\[Amazon Transcribe コンソールのスクリーンショット: 展開された「言語設定」タブ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/lang-id-stream2.png)

1. 文字起こしの言語コードを 2 つ以上指定してください。1 つの言語ごとに 1 つの方言しか提供できません。例えば、`en-US` と `en-GB` を同じ文字起こしの言語オプションとして選択することはできません。  
![\[Amazon Transcribe コンソールのスクリーンショット: 言語コード選択ドロップダウンメニュー。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/lang-id-stream3.png)

1. (オプション) 前の手順で選択した言語のサブセットから、トランスクリプトの優先言語を選択できます。  
![\[Amazon Transcribe コンソールのスクリーンショット: 「言語設定」パネルと優先言語オプション。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/lang-id-stream4.png)

1. これで、ストリームを書き起こす準備ができました。[**ストリーミングを開始する**] を選択し、話し始めます。ディクテーションを終了するには、[**ストリーミングを停止する**] を選択します。

### HTTP/2 ストリーム
<a name="lang-id-http2"></a>

この例では、言語識別を有効にした状態で HTTP/2 リクエストを作成します。での HTTP/2 ストリーミングの使用の詳細については Amazon Transcribe、「」を参照してください[HTTP/2 ストリームの設定](streaming-setting-up.md#streaming-http2)。固有のパラメータとヘッダーの詳細については Amazon Transcribe、「」を参照してください[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)。

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-language: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked
```

この例では、多言語識別を有効にして HTTP/2 リクエストを作成します。での HTTP/2 ストリーミングの使用の詳細については Amazon Transcribe、「」を参照してください[HTTP/2 ストリームの設定](streaming-setting-up.md#streaming-http2)。固有のパラメータとヘッダーの詳細については Amazon Transcribe、「」を参照してください[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)。

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-multiple-languages: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked
```

リクエストで `identify-language` または `identify-multiple-languages` を使用する場合は、`language-options` も含める必要があります。同じリクエストで `language-code` と `identify-language` 両方を使用することはできません。

パラメータ定義は [API リファレンス](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)にあります。すべての AWS API オペレーションに共通のパラメータは、[「共通パラメータ](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html)」セクションに記載されています。

### WebSocket ストリーム
<a name="lang-id-websocket"></a>

この例では、WebSocket ストリーミングで言語識別を使用する署名付き URL を作成します。読みやすくするために、改行が追加されています。で WebSocket ストリームを使用する方法の詳細については Amazon Transcribe、「」を参照してください[WebSocket ストリームの設定](streaming-setting-up.md#streaming-websocket)。パラメータの詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)」を参照してください。

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-language=true
&language-options=en-US,de-DE
&preferred-language=en-US
```

この例では、WebSocket ストリームで多言語識別を使用する署名付き URL を作成します。読みやすくするために、改行が追加されています。で WebSocket ストリームを使用する方法の詳細については Amazon Transcribe、「」を参照してください[WebSocket ストリームの設定](streaming-setting-up.md#streaming-websocket)。パラメータの詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)」を参照してください。

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-multiple-languages=true
&language-options=en-US,de-DE
&preferred-language=en-US
```

リクエストで `identify-language` または `identify-multiple-languages` を使用する場合は、`language-options` も含める必要があります。同じリクエストで `language-code` と `identify-language` 両方を使用することはできません。

パラメータ定義は [API リファレンス](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)にあります。すべての AWS API オペレーションに共通のパラメータは、[「共通パラメータ](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html)」セクションに記載されています。