

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 스트리밍 트랜스크립션을 통한 언어 식별
<a name="lang-id-stream"></a>

스트리밍 언어 식별은 미디어 스트림에서 사용되는 지배적 언어를 식별할 수 있습니다.는 언어를 식별하려면 최소 1초의 음성이 Amazon Transcribe 필요합니다.

스트림에 한 가지 언어만 포함된 경우 단일 언어 식별을 활성화하여 미디어 파일에서 사용되는 지배적 언어를 식별하고 이 언어만 사용하여 트랜스크립트를 생성할 수 있습니다.

스트림에 두 개 이상의 언어가 포함된 경우 다국어 식별을 활성화하여 스트림에서 사용되는 모든 언어를 식별하고 식별된 각 언어를 사용하여 트랜스크립트를 생성할 수 있습니다. 다국어 트랜스크립트가 생성된다는 점에 유의하세요. 와 같은 다른 서비스를 사용하여 트랜스크립트 Amazon Transcribe를 번역할 수 있습니다.

스트리밍 언어 식별을 사용하려면 언어 코드를 두 개 이상 제공해야 하며 스트림당 언어당 언어 방언을 하나만 선택할 수 있습니다. 즉, 동일한 트랜스크립션에 대해 `en-US` 및 `en-AU`를 언어 옵션으로 선택할 수 없습니다.

또한 제공하는 언어 코드 세트에서 기본 언어를 선택할 수도 있습니다. 기본 언어를 추가하면 언어 식별 프로세스의 속도를 높일 수 있으므로 짧은 오디오 클립에 유용합니다.

**중요**  
제공한 언어 코드가 오디오에서 식별된 언어와 일치하지 않는 경우는 지정된 언어 코드에서 가장 가까운 언어 일치를 Amazon Transcribe 선택합니다. 그런 다음 해당 언어로 트랜스크립트를 생성합니다. 예를 들어 미디어가 미국 영어(`en-US`)이고 언어 코드 `zh-CN`, `fr-FR`및를 Amazon Transcribe 제공하는 경우 `de-DE` Amazon Transcribe 는 미디어를 독일어(`de-DE`)와 일치시키고 독일어 트랜스크립션을 생성할 수 있습니다. 언어 코드와 음성 언어가 일치하지 않으면 트랜스크립트가 정확하지 않을 수 있으므로 언어 코드를 포함할 때는 주의를 기울이는 것이 좋습니다.

미디어에 두 개의 채널이 포함된 경우는 각 채널에서 사용되는 지배적 언어를 식별할 Amazon Transcribe 수 있습니다. 이 경우 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html#transcribe-Type-Settings-ChannelIdentification](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html#transcribe-Type-Settings-ChannelIdentification) 파라미터를 `true`로 설정하면 각 채널이 개별적으로 트랜스크립션됩니다. 이 파라미터의 기본값은 `false`입니다. 변경하지 않으면 첫 번째 채널만 트랜스크립션되고 하나의 언어만 식별됩니다.

스트리밍 언어 식별은 사용자 지정 언어 모델 또는 편집과 결합할 수 없습니다. 언어 식별을 다른 기능과 결합하는 경우 해당 기능과 스트리밍 트랜스크립션에서 지원되는 언어로 제한됩니다. [지원되는 언어](supported-languages.md)를 참조하세요.

**참고**  
스트리밍 언어 식별에 지원되는 오디오 형식은 PCM 및 FLAC뿐입니다. 다국어 식별의 경우 PCM만 지원됩니다.

## 다국어 오디오의 언어 식별
<a name="multi-language-streaming"></a>

다국어 식별은 다국어 스트림을 위한 것으로 스트림에서 사용되는 지원되는 언어 모두를 반영하는 트랜스크립트를 제공합니다. 즉, 화자가 대화 도중에 언어를 바꾸거나 각 참가자가 서로 다른 언어를 사용하는 경우 트랜스크립션 출력은 각 언어를 올바르게 감지하고 트랜스크립션합니다.

예를 들어 스트림에 미국 영어(`en-US`)와 힌디어(`hi-IN`)를 번갈아 사용하는 이중 언어 화자가 포함되어 있는 경우 다국어 식별을 통해 미국 영어는 `en-US`로 힌디어는 `hi-IN`으로 식별하고 트랜스크립션할 수 있습니다. 이는 한 가지 지배적 언어만 사용하여 트랜스크립트를 작성하는 단일 언어 식별과는 다릅니다. 이 경우 지배적 언어가 아닌 음성 언어는 부정확하게 트랜스크립션됩니다.

**참고**  
현재 다국어 식별에서는 교정 및 사용자 지정 언어 모델이 지원되지 않습니다.

## 스트리밍 미디어를 통한 언어 식별 사용
<a name="lang-id-stream-examples"></a>

**AWS Management Console**, **HTTP/2** 또는 **WebSockets**를 사용하여 스트리밍 트랜스크립션에서 자동 언어 식별을 사용할 수 있습니다. 예를 보려면 다음을 참조하세요.

### AWS Management Console
<a name="lang-id-console-stream"></a>

1. [AWS Management Console](https://console.aws.amazon.com/transcribe/)에 로그인합니다.

1. 탐색 창에서 **실시간 트랜스크립션**을 선택합니다. **언어 설정**까지 아래로 스크롤하고 최소화된 경우 이 필드를 확장합니다.  
![\[Amazon Transcribe 콘솔 스크린샷: '실시간 트랜스크립션' 페이지의 축소된 '언어 설정' 탭.\]](http://docs.aws.amazon.com/ko_kr/transcribe/latest/dg/images/lang-id-stream1.png)

1. **자동 언어 식별** 또는 **자동 다국어 식별**을 선택합니다.  
![\[Amazon Transcribe 콘솔 스크린샷: 확장된 '언어 설정' 탭.\]](http://docs.aws.amazon.com/ko_kr/transcribe/latest/dg/images/lang-id-stream2.png)

1. 트랜스크립션에 사용할 언어 코드를 최소 두 개 제공합니다. 언어당 방언을 하나만 제공할 수 있다는 점에 유의하세요. 예를 들어 동일한 트랜스크립션에 대해 `en-US` 및 `en-GB` 모두를 언어 옵션으로 선택할 수 없습니다.  
![\[Amazon Transcribe 콘솔 스크린샷: 언어 코드 선택 드롭다운 메뉴.\]](http://docs.aws.amazon.com/ko_kr/transcribe/latest/dg/images/lang-id-stream3.png)

1. (선택 사항) 이전 단계에서 선택한 언어 하위 집합 중에서 트랜스크립트에 사용할 기본 언어를 선택할 수 있습니다.  
![\[Amazon Transcribe 콘솔 스크린샷: 선호하는 언어 옵션이 있는 '언어 설정' 패널.\]](http://docs.aws.amazon.com/ko_kr/transcribe/latest/dg/images/lang-id-stream4.png)

1. 이제 스트림을 트랜스크립션할 준비가 되었습니다. **스트리밍 시작**을 선택하고 말하기 시작합니다. 구술을 끝내려면 **스트리밍 중지**를 선택합니다.

### HTTP/2 스트림
<a name="lang-id-http2"></a>

이 예시에서는 언어 식별이 활성화된 HTTP/2 요청을 생성합니다. 에서 HTTP/2 스트리밍을 사용하는 방법에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[HTTP/2 스트림 설정](streaming-setting-up.md#streaming-http2). 관련 파라미터 및 헤더에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-language: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked
```

이 예시에서는 다국어 식별이 활성화된 HTTP/2 요청을 생성합니다. 에서 HTTP/2 스트리밍을 사용하는 방법에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[HTTP/2 스트림 설정](streaming-setting-up.md#streaming-http2). 관련 파라미터 및 헤더에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-multiple-languages: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked
```

요청에 `identify-language` 또는 `identify-multiple-languages`를 사용하는 경우 `language-options` 역시 포함해야 합니다. 동일한 요청에서 `language-code` 및 `identify-language` 둘 다 사용할 수는 없습니다.

파라미터 정의는 [API 참조](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)에서 찾을 수 있습니다. 모든 AWS API 작업에 공통적인 파라미터는 [공통 파라미터](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html) 섹션에 나열되어 있습니다.

### WebSocket 스트림
<a name="lang-id-websocket"></a>

이 예시에서는 WebSocket 스트림에서 언어 식별을 사용하는 미리 서명된 URL을 만듭니다. 가독성을 높이기 위해 줄바꿈이 추가되었습니다. 에서 WebSocket 스트림을 사용하는 방법에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[WebSocket 스트림 설정](streaming-setting-up.md#streaming-websocket). 파라미터에 대한 자세한 내용은 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)을 참조하세요.

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-language=true
&language-options=en-US,de-DE
&preferred-language=en-US
```

이 예시에서는 WebSocket 스트림에서 다국어 식별을 사용하는 미리 서명된 URL을 만듭니다. 가독성을 높이기 위해 줄바꿈이 추가되었습니다. 에서 WebSocket 스트림을 사용하는 방법에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[WebSocket 스트림 설정](streaming-setting-up.md#streaming-websocket). 파라미터에 대한 자세한 내용은 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)을 참조하세요.

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-multiple-languages=true
&language-options=en-US,de-DE
&preferred-language=en-US
```

요청에 `identify-language` 또는 `identify-multiple-languages`를 사용하는 경우 `language-options` 역시 포함해야 합니다. 동일한 요청에서 `language-code` 및 `identify-language` 둘 다 사용할 수는 없습니다.

파라미터 정의는 [API 참조](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)에서 찾을 수 있습니다. 모든 AWS API 작업에 공통적인 파라미터는 [공통 파라미터](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html) 섹션에 나열되어 있습니다.