

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 미디어의 지배적 언어 식별
<a name="lang-id"></a>

Amazon Transcribe를 사용하면 언어 코드를 지정하지 않고도 미디어에서 사용되는 언어를 자동으로 식별할 수 있습니다.

[배치 언어 식별](lang-id-batch.md)은 미디어 파일에서 사용되는 지배적 언어를 식별할 수 있으며, 미디어에 여러 언어가 포함된 경우 사용되는 모든 언어를 식별할 수 있습니다. 언어 식별 정확도를 높이기 위해 미디어에 있을 것으로 생각되는 두 개 이상의 언어 목록을 선택적으로 제공할 수 있습니다.

[스트리밍 언어 식별](lang-id-stream.md)은 채널당 하나의 언어(최대 2개 채널 지원)를 식별할 수 있으며, 스트림에 여러 언어가 포함된 경우 사용되는 모든 언어를 식별할 수 있습니다. 스트리밍 요청에는 요청에 최소 두 개의 추가 언어 옵션이 포함되어야 합니다. 언어 옵션을 제공하면 언어 식별이 더 빨라집니다. Amazon Transcribe가 언어를 더 빨리 식별할수록 스트림의 처음 몇 초 동안 발생하는 데이터 손실의 가능성이 더 줄어듭니다.

**중요**  
배치 트랜스크립션과 스트리밍 트랜스크립션은 서로 다른 언어를 지원합니다. 자세한 내용은 [지원되는 언어 테이블](supported-languages.md)의 **데이터 입력** 열을 참조하세요. 참고로 스웨덴어와 베트남어는 현재 언어 식별이 지원되지 않습니다.

언어 식별을 통한 모니터링 및 이벤트에 대한 자세한 내용은 [언어 식별 이벤트](monitoring-events.md#lang-id-event)를 참조하세요.

# 배치 트랜스크립션 작업을 통한 언어 식별
<a name="lang-id-batch"></a>

배치 언어 식별을 사용하여 미디어 파일의 언어를 자동으로 식별합니다.

미디어에 한 가지 언어만 포함된 경우 [단일 언어 식별](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html#transcribe-StartTranscriptionJob-request-IdentifyLanguage)을 활성화하여 미디어 파일에서 사용되는 지배적 언어를 식별하고 이 언어만 사용하여 트랜스크립트를 생성할 수 있습니다.

미디어에 두 개 이상의 언어가 포함된 경우 [다국어 식별](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html#transcribe-StartTranscriptionJob-request-IdentifyMultipleLanguages)을 활성화하여 미디어 파일에서 사용되는 모든 언어를 식별하고 식별된 각 언어를 사용하여 트랜스크립트를 생성할 수 있습니다. 다국어 트랜스크립트가 생성된다는 점에 유의하세요. 와 같은 다른 서비스를 사용하여 트랜스크립트 Amazon Translate를 번역할 수 있습니다.

지원되는 언어 및 관련 언어 코드의 전체 목록은 [지원되는 언어](supported-languages.md) 테이블을 참조하세요.

최상의 결과를 얻으려면 미디어 파일에 30초 이상의 음성이 포함되어 있어야 합니다.

 AWS Management Console AWS CLI및 AWS Python SDK를 사용한 사용 예제는 섹션을 참조하세요[배치 트랜스크립션 작업을 통한 언어 식별 사용](#lang-id-batch-examples).

## 다국어 오디오의 언어 식별
<a name="lang-id-batch-multi-language"></a>

다국어 식별은 다국어 미디어 파일을 위한 것으로 미디어에서 사용되는 [지원되는 언어](supported-languages.md) 모두를 반영하는 트랜스크립트를 제공합니다. 즉, 화자가 대화 도중에 언어를 바꾸거나 각 참가자가 서로 다른 언어를 사용하는 경우 트랜스크립션 출력은 각 언어를 올바르게 감지하고 트랜스크립션합니다. 예를 들어 미디어에 미국 영어(`en-US`)와 힌디어(`hi-IN`)를 번갈아 사용하는 이중 언어 화자가 포함되어 있는 경우 다국어 식별을 통해 미국 영어는 `en-US`로 힌디어는 `hi-IN`으로 식별하고 트랜스크립션할 수 있습니다.

이는 한 가지 지배적 언어만 사용하여 트랜스크립트를 작성하는 단일 언어 식별과는 다릅니다. 이 경우 지배적 언어가 아닌 음성 언어는 부정확하게 트랜스크립션됩니다.

**참고**  
현재 다국어 식별에서는 교정 및 사용자 지정 언어 모델이 지원되지 않습니다.

**참고**  
현재 다국어 식별이 지원되는 언어는 다음과 같습니다. en-AB, en-AU, en-GB, en-IE, en-IN, en-NZ, en-US, en-WL, en-ZA, es-ES, es-US, fr-CA, fr-FR, zh-CN, zh-TW, pt-BR, pt-PT, de-CH, de-DE, af-ZA, ar-AE, da-DK, he-IL, hi-IN, id-ID, fa-IR, it-IT, ja-JP, ko-KR, ms-MY, nl-NL, ru-RU, ta-IN, te-IN, th-TH, tr-TR 

다국어 트랜스크립트에는 감지된 언어 및 미디어에서 각 언어가 사용된 총 시간이 요약되어 있습니다. 다음은 그 예입니다.

```
"results": {
        "transcripts": [
            {
                "transcript": "welcome to Amazon transcribe. ये तो उदाहरण हैं क्या कैसे कर सकते हैं ।一つのファイルに複数の言語を書き写す"
            }
        ],

    ...

        "language_codes": [
            {
                "language_code": "en-US",
                "duration_in_seconds": 2.45
            },
            {
                "language_code": "hi-IN",
                "duration_in_seconds": 5.325
            },
            {
                "language_code": "ja-JP",
                "duration_in_seconds": 4.15
            }
        ]
}
```

## 언어 식별 정확도 향상
<a name="lang-id-batch-improve-accuracy"></a>

언어 식별을 사용하면 미디어에 있을 것으로 생각되는 언어 목록을 포함할 수 있습니다. 언어 옵션(`LanguageOptions`)을 포함하면 오디오를 올바른 언어와 일치시킬 때 지정한 언어만 Amazon Transcribe 사용하도록 제한되므로 언어 식별 속도가 빨라지고 올바른 언어 언어 할당과 관련된 정확도가 향상될 수 있습니다.

언어 코드를 포함하려면 두 개 이상 포함해야 합니다. 포함할 수 있는 언어 코드 수에는 제한이 없지만 최적의 효율성과 정확도를 위해 2\$15개 사이를 사용하는 것이 좋습니다.

**참고**  
요청에 언어 코드를 포함하고 제공한 언어 코드가 오디오에서 식별된 언어와 일치하지 않는 경우는 지정된 언어 코드에서 가장 가까운 언어 일치를 Amazon Transcribe 선택합니다. 그런 다음 해당 언어로 트랜스크립트를 생성합니다. 예를 들어 미디어가 미국 영어(`en-US`)이고 언어 코드 `zh-CN`, `fr-FR`및를 Amazon Transcribe 제공하는 경우 미디어를 독일어(`de-DE`)와 일치시키고 독일어 `de-DE` Amazon Transcribe 트랜스크립션을 생성할 수 있습니다. 언어 코드와 음성 언어가 일치하지 않으면 트랜스크립트가 정확하지 않을 수 있으므로 언어 코드를 포함할 때는 주의를 기울이는 것이 좋습니다.

## 언어 식별을 다른 Amazon Transcribe 기능과 결합
<a name="lang-id-batch-features"></a>

배치 언어 식별을 다른 Amazon Transcribe 기능과 함께 사용할 수 있습니다. 언어 식별을 다른 기능과 결합하는 경우 해당 기능에서 지원되는 언어로 제한됩니다. 예를 들어 콘텐츠 편집과 함께 언어 식별을 사용하는 경우, 편집이 가능한 유일한 언어이므로 미국 영어(`en-US`) 또는 미국 스페인어(`es-US`)로 제한됩니다. 자세한 내용은 [지원되는 언어 및 언어별 기능](supported-languages.md) 섹션을 참조하세요.

**중요**  
콘텐츠 편집이 활성화된 상태에서 자동 언어 식별을 사용하고 오디오에 미국 영어(`en-US`) 또는 미국 스페인어(`es-US`) 이외의 언어가 포함된 경우 미국 영어 혹은 미국 스페인어 콘텐츠만 트랜스크립트에서 편집됩니다. 다른 언어는 편집할 수 없으며 경고나 작업 실패도 없습니다.



**사용자 지정 언어 모델, 사용자 지정 어휘 및 사용자 지정 어휘 필터**

언어 식별 요청에 사용자 지정 언어 모델, 사용자 지정 어휘 또는 사용자 지정 어휘 필터를 하나 이상 추가하려면 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html) 파라미터를 포함해야 합니다. 그런 다음 해당하는 사용자 지정 언어 모델, 사용자 지정 어휘 및 사용자 지정 어휘 필터를 사용하여 언어 코드를 지정할 수 있습니다. 다국어 식별은 사용자 지정 언어 모델을 지원하지 않는다는 점에 유의하세요.

올바른 언어 방언을 식별할 수 있도록 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html)을 사용할 때 `LanguageOptions`을 포함하는 것이 좋습니다. 예를 들어 사용자 `en-US` 지정 어휘를 지정했지만 미디어에서 사용되는 언어가 라고 Amazon Transcribe 판단되면 `en-AU`사용자 지정 어휘*가 트랜스크립션에 적용되지 않습니다*. `LanguageOptions`을 포함하고 유일한 영어 방언으로 `en-US`를 지정하는 경우 사용자 지정 어휘가 트랜스크립션에 적용*됩니다*.

요청의 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html) 예시는 [배치 트랜스크립션 작업을 통한 언어 식별 사용](#lang-id-batch-examples) 섹션의 **AWS CLI** 및 **AWS SDK** 드롭다운 패널에서 옵션 2를 참조하세요.

## 배치 트랜스크립션 작업을 통한 언어 식별 사용
<a name="lang-id-batch-examples"></a>

**AWS Management Console**, **AWS CLI** 또는 **AWS SDK**를 사용하여 배치 트랜스크립션 작업에서 자동 언어 식별을 사용할 수 있습니다. 예를 보려면 다음을 참조하세요.

### AWS Management Console
<a name="lang-id-console-batch"></a>

1. [AWS Management Console](https://console.aws.amazon.com/transcribe/)에 로그인합니다.

1. 탐색 창에서 **트랜스크립션 작업**을 선택한 다음 **작업 생성**(오른쪽 상단)을 선택합니다. 그러면 **작업 세부 정보 지정** 페이지가 열립니다.

1. **작업 설정** 패널에서 **언어 설정** 섹션을 찾아 **자동 언어 식별** 또는 **자동 다국어 식별**을 선택합니다.

   오디오 파일에 어떤 언어가 있는지 알고 있으면 (*언어 선택* 드롭다운 상자에서) 다국어 옵션을 선택할 수 있습니다. 언어 옵션을 제공하면 정확도를 높일 수 있지만 필수는 아닙니다.  
![\[Amazon Transcribe 콘솔 스크린샷: '작업 세부 정보 지정' 페이지의 '작업 설정' 창.\]](http://docs.aws.amazon.com/ko_kr/transcribe/latest/dg/images/lang-id-batch1.png)

1. **작업 세부 정보 지정** 페이지에 포함하려는 다른 필드를 모두 채운 후 **다음**을 선택합니다. 그러면 **작업 구성 - *선택 사항*** 페이지로 이동합니다.  
![\[Amazon Transcribe 콘솔 스크린샷: '작업 구성' 페이지.\]](http://docs.aws.amazon.com/ko_kr/transcribe/latest/dg/images/lang-id-configure-batch.png)

1. **작업 생성**을 선택하여 트랜스크립션 작업을 실행합니다.

### AWS CLI
<a name="lang-id-cli"></a>

이 예시에서는 [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html) 명령 및 `IdentifyLanguage` 파라미터를 사용합니다. 자세한 내용은 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) 및 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html) 섹션을 참조하세요.

**옵션 1**: `language-id-settings` 파라미터 없음. 요청에 사용자 지정 언어 모델, 사용자 지정 어휘 또는 사용자 지정 어휘 필터를 포함하지 **않는** 경우 이 옵션을 사용합니다. `language-options`은 선택 사항이며, 권장 사항은 아닙니다.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \    
--identify-language \  (or --identify-multiple-languages) \
--language-options "en-US" "hi-IN"
```

**옵션 2**: `language-id-settings` 파라미터 있음. 요청에 사용자 지정 언어 모델, 사용자 지정 어휘 또는 사용자 지정 어휘 필터를 포함**하는** 경우 이 옵션을 사용합니다.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--identify-language \  (or --identify-multiple-languages)
--language-options "en-US" "hi-IN" \
--language-id-settings en-US=VocabularyName=my-en-US-vocabulary,en-US=VocabularyFilterName=my-en-US-vocabulary-filter,en-US=LanguageModelName=my-en-US-language-model,hi-IN=VocabularyName=my-hi-IN-vocabulary,hi-IN=VocabularyFilterName=my-hi-IN-vocabulary-filter
```

다음은 [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html) 명령을 사용하는 또 다른 예 및 언어를 식별하는 요청 본문입니다.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-language-id-job.json
```

*my-first-language-id-job.json* 파일에는 다음과 같은 요청 본문이 포함되어 있습니다.

**옵션 1**: `LanguageIdSettings` 파라미터 없음. 요청에 사용자 지정 언어 모델, 사용자 지정 어휘 또는 사용자 지정 어휘 필터를 포함하지 **않는** 경우 이 옵션을 사용합니다. `LanguageOptions`은 선택 사항이며, 권장 사항은 아닙니다.

```
{
  "TranscriptionJobName": "my-first-transcription-job",  
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "IdentifyLanguage": true,  (or "IdentifyMultipleLanguages": true),
  "LanguageOptions": [
        "en-US", "hi-IN"  
  ]
}
```

**옵션 2**: `LanguageIdSettings` 파라미터 있음. 요청에 사용자 지정 언어 모델, 사용자 지정 어휘 또는 사용자 지정 어휘 필터를 포함**하는** 경우 이 옵션을 사용합니다.

```
{
   "TranscriptionJobName": "my-first-transcription-job",  
   "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
   "OutputBucketName": "amzn-s3-demo-bucket",
   "OutputKey": "my-output-files/", 
   "IdentifyLanguage": true,  (or "IdentifyMultipleLanguages": true)
   "LanguageOptions": [
        "en-US", "hi-IN"  
   ],
   "LanguageIdSettings": { 
         "en-US" : { 
            "LanguageModelName": "my-en-US-language-model",
            "VocabularyFilterName": "my-en-US-vocabulary-filter",
            "VocabularyName": "my-en-US-vocabulary"
         },
         "hi-IN": {
             "VocabularyName": "my-hi-IN-vocabulary",
             "VocabularyFilterName": "my-hi-IN-vocabulary-filter"
         }
    }
}
```

### AWS SDK for Python (Boto3)
<a name="lang-id-python-batch"></a>

이 예제에서는 AWS SDK for Python (Boto3) 를 사용하여 [start\$1transcription\$1job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job) 메서드에 대한 `IdentifyLanguage` 인수를 사용하여 파일의 언어를 식별합니다. 자세한 내용은 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) 및 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html) 섹션을 참조하세요.

기능별, 시나리오 및 교차 서비스 예제 AWS SDKs를 사용하는 추가 예제는 [AWS SDKs를 사용한 Amazon Transcribe의 코드 예제](service_code_examples.md)장을 참조하세요.

**옵션 1**: `LanguageIdSettings` 파라미터 없음. 요청에 사용자 지정 언어 모델, 사용자 지정 어휘 또는 사용자 지정 어휘 필터를 포함하지 **않는** 경우 이 옵션을 사용합니다. `LanguageOptions`은 선택 사항이며, 권장 사항은 아닙니다.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/',
    MediaFormat = 'flac',
    IdentifyLanguage = True,  (or IdentifyMultipleLanguages = True),
    LanguageOptions = [
        'en-US', 'hi-IN'
    ]
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**옵션 2**: `LanguageIdSettings` 파라미터 있음. 요청에 사용자 지정 언어 모델, 사용자 지정 어휘 또는 사용자 지정 어휘 필터를 포함**하는** 경우 이 옵션을 사용합니다.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    MediaFormat='flac',
    IdentifyLanguage=True,  (or IdentifyMultipleLanguages=True)
    LanguageOptions = [
        'en-US', 'hi-IN'
    ],
    LanguageIdSettings={
        'en-US': {
            'VocabularyName': 'my-en-US-vocabulary',
            'VocabularyFilterName': 'my-en-US-vocabulary-filter',
            'LanguageModelName': 'my-en-US-language-model'
        },
        'hi-IN': {
            'VocabularyName': 'my-hi-IN-vocabulary',
            'VocabularyFilterName': 'my-hi-IN-vocabulary-filter'
        }   
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

# 스트리밍 트랜스크립션을 통한 언어 식별
<a name="lang-id-stream"></a>

스트리밍 언어 식별은 미디어 스트림에서 사용되는 지배적 언어를 식별할 수 있습니다.는 언어를 식별하려면 최소 1초의 음성이 Amazon Transcribe 필요합니다.

스트림에 한 가지 언어만 포함된 경우 단일 언어 식별을 활성화하여 미디어 파일에서 사용되는 지배적 언어를 식별하고 이 언어만 사용하여 트랜스크립트를 생성할 수 있습니다.

스트림에 두 개 이상의 언어가 포함된 경우 다국어 식별을 활성화하여 스트림에서 사용되는 모든 언어를 식별하고 식별된 각 언어를 사용하여 트랜스크립트를 생성할 수 있습니다. 다국어 트랜스크립트가 생성된다는 점에 유의하세요. 와 같은 다른 서비스를 사용하여 트랜스크립트 Amazon Transcribe를 번역할 수 있습니다.

스트리밍 언어 식별을 사용하려면 언어 코드를 두 개 이상 제공해야 하며 스트림당 언어당 언어 방언을 하나만 선택할 수 있습니다. 즉, 동일한 트랜스크립션에 대해 `en-US` 및 `en-AU`를 언어 옵션으로 선택할 수 없습니다.

또한 제공하는 언어 코드 세트에서 기본 언어를 선택할 수도 있습니다. 기본 언어를 추가하면 언어 식별 프로세스의 속도를 높일 수 있으므로 짧은 오디오 클립에 유용합니다.

**중요**  
제공한 언어 코드가 오디오에서 식별된 언어와 일치하지 않는 경우는 지정된 언어 코드에서 가장 가까운 언어 일치를 Amazon Transcribe 선택합니다. 그런 다음 해당 언어로 트랜스크립트를 생성합니다. 예를 들어 미디어가 미국 영어(`en-US`)이고 언어 코드 `zh-CN`, `fr-FR`및를 Amazon Transcribe 제공하는 경우 `de-DE` Amazon Transcribe 는 미디어를 독일어(`de-DE`)와 일치시키고 독일어 트랜스크립션을 생성할 수 있습니다. 언어 코드와 음성 언어가 일치하지 않으면 트랜스크립트가 정확하지 않을 수 있으므로 언어 코드를 포함할 때는 주의를 기울이는 것이 좋습니다.

미디어에 두 개의 채널이 포함된 경우는 각 채널에서 사용되는 지배적 언어를 식별할 Amazon Transcribe 수 있습니다. 이 경우 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html#transcribe-Type-Settings-ChannelIdentification](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html#transcribe-Type-Settings-ChannelIdentification) 파라미터를 `true`로 설정하면 각 채널이 개별적으로 트랜스크립션됩니다. 이 파라미터의 기본값은 `false`입니다. 변경하지 않으면 첫 번째 채널만 트랜스크립션되고 하나의 언어만 식별됩니다.

스트리밍 언어 식별은 사용자 지정 언어 모델 또는 편집과 결합할 수 없습니다. 언어 식별을 다른 기능과 결합하는 경우 해당 기능과 스트리밍 트랜스크립션에서 지원되는 언어로 제한됩니다. [지원되는 언어](supported-languages.md)를 참조하세요.

**참고**  
스트리밍 언어 식별에 지원되는 오디오 형식은 PCM 및 FLAC뿐입니다. 다국어 식별의 경우 PCM만 지원됩니다.

## 다국어 오디오의 언어 식별
<a name="multi-language-streaming"></a>

다국어 식별은 다국어 스트림을 위한 것으로 스트림에서 사용되는 지원되는 언어 모두를 반영하는 트랜스크립트를 제공합니다. 즉, 화자가 대화 도중에 언어를 바꾸거나 각 참가자가 서로 다른 언어를 사용하는 경우 트랜스크립션 출력은 각 언어를 올바르게 감지하고 트랜스크립션합니다.

예를 들어 스트림에 미국 영어(`en-US`)와 힌디어(`hi-IN`)를 번갈아 사용하는 이중 언어 화자가 포함되어 있는 경우 다국어 식별을 통해 미국 영어는 `en-US`로 힌디어는 `hi-IN`으로 식별하고 트랜스크립션할 수 있습니다. 이는 한 가지 지배적 언어만 사용하여 트랜스크립트를 작성하는 단일 언어 식별과는 다릅니다. 이 경우 지배적 언어가 아닌 음성 언어는 부정확하게 트랜스크립션됩니다.

**참고**  
현재 다국어 식별에서는 교정 및 사용자 지정 언어 모델이 지원되지 않습니다.

## 스트리밍 미디어를 통한 언어 식별 사용
<a name="lang-id-stream-examples"></a>

**AWS Management Console**, **HTTP/2** 또는 **WebSockets**를 사용하여 스트리밍 트랜스크립션에서 자동 언어 식별을 사용할 수 있습니다. 예를 보려면 다음을 참조하세요.

### AWS Management Console
<a name="lang-id-console-stream"></a>

1. [AWS Management Console](https://console.aws.amazon.com/transcribe/)에 로그인합니다.

1. 탐색 창에서 **실시간 트랜스크립션**을 선택합니다. **언어 설정**까지 아래로 스크롤하고 최소화된 경우 이 필드를 확장합니다.  
![\[Amazon Transcribe 콘솔 스크린샷: '실시간 트랜스크립션' 페이지의 축소된 '언어 설정' 탭.\]](http://docs.aws.amazon.com/ko_kr/transcribe/latest/dg/images/lang-id-stream1.png)

1. **자동 언어 식별** 또는 **자동 다국어 식별**을 선택합니다.  
![\[Amazon Transcribe 콘솔 스크린샷: 확장된 '언어 설정' 탭.\]](http://docs.aws.amazon.com/ko_kr/transcribe/latest/dg/images/lang-id-stream2.png)

1. 트랜스크립션에 사용할 언어 코드를 최소 두 개 제공합니다. 언어당 방언을 하나만 제공할 수 있다는 점에 유의하세요. 예를 들어 동일한 트랜스크립션에 대해 `en-US` 및 `en-GB` 모두를 언어 옵션으로 선택할 수 없습니다.  
![\[Amazon Transcribe 콘솔 스크린샷: 언어 코드 선택 드롭다운 메뉴.\]](http://docs.aws.amazon.com/ko_kr/transcribe/latest/dg/images/lang-id-stream3.png)

1. (선택 사항) 이전 단계에서 선택한 언어 하위 집합 중에서 트랜스크립트에 사용할 기본 언어를 선택할 수 있습니다.  
![\[Amazon Transcribe 콘솔 스크린샷: 선호하는 언어 옵션이 있는 '언어 설정' 패널.\]](http://docs.aws.amazon.com/ko_kr/transcribe/latest/dg/images/lang-id-stream4.png)

1. 이제 스트림을 트랜스크립션할 준비가 되었습니다. **스트리밍 시작**을 선택하고 말하기 시작합니다. 구술을 끝내려면 **스트리밍 중지**를 선택합니다.

### HTTP/2 스트림
<a name="lang-id-http2"></a>

이 예시에서는 언어 식별이 활성화된 HTTP/2 요청을 생성합니다. 에서 HTTP/2 스트리밍을 사용하는 방법에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[HTTP/2 스트림 설정](streaming-setting-up.md#streaming-http2). 관련 파라미터 및 헤더에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-language: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked
```

이 예시에서는 다국어 식별이 활성화된 HTTP/2 요청을 생성합니다. 에서 HTTP/2 스트리밍을 사용하는 방법에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[HTTP/2 스트림 설정](streaming-setting-up.md#streaming-http2). 관련 파라미터 및 헤더에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-multiple-languages: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked
```

요청에 `identify-language` 또는 `identify-multiple-languages`를 사용하는 경우 `language-options` 역시 포함해야 합니다. 동일한 요청에서 `language-code` 및 `identify-language` 둘 다 사용할 수는 없습니다.

파라미터 정의는 [API 참조](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)에서 찾을 수 있습니다. 모든 AWS API 작업에 공통적인 파라미터는 [공통 파라미터](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html) 섹션에 나열되어 있습니다.

### WebSocket 스트림
<a name="lang-id-websocket"></a>

이 예시에서는 WebSocket 스트림에서 언어 식별을 사용하는 미리 서명된 URL을 만듭니다. 가독성을 높이기 위해 줄바꿈이 추가되었습니다. 에서 WebSocket 스트림을 사용하는 방법에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[WebSocket 스트림 설정](streaming-setting-up.md#streaming-websocket). 파라미터에 대한 자세한 내용은 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)을 참조하세요.

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-language=true
&language-options=en-US,de-DE
&preferred-language=en-US
```

이 예시에서는 WebSocket 스트림에서 다국어 식별을 사용하는 미리 서명된 URL을 만듭니다. 가독성을 높이기 위해 줄바꿈이 추가되었습니다. 에서 WebSocket 스트림을 사용하는 방법에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요[WebSocket 스트림 설정](streaming-setting-up.md#streaming-websocket). 파라미터에 대한 자세한 내용은 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)을 참조하세요.

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-multiple-languages=true
&language-options=en-US,de-DE
&preferred-language=en-US
```

요청에 `identify-language` 또는 `identify-multiple-languages`를 사용하는 경우 `language-options` 역시 포함해야 합니다. 동일한 요청에서 `language-code` 및 `identify-language` 둘 다 사용할 수는 없습니다.

파라미터 정의는 [API 참조](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)에서 찾을 수 있습니다. 모든 AWS API 작업에 공통적인 파라미터는 [공통 파라미터](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html) 섹션에 나열되어 있습니다.