

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Melhorar a precisão da transcrição com vocabulários médicos personalizados
<a name="vocabulary-med"></a>

Para melhorar a precisão da transcrição em Amazon Transcribe Medicina, crie e use um ou mais vocabulários médicos personalizados. Um *vocabulário personalizado* é um conjunto de palavras ou frases específicas de um domínio. Esta coleção ajuda a melhorar o desempenho da Amazon Transcribe Medicina na transcrição dessas palavras ou frases.

Você é responsável pela integridade de seus próprios dados ao usar o Amazon Transcribe Medical. Não insira informações confidenciais, informações de identificação pessoal (PII) ou informações de saúde protegidas (PHI) em um vocabulário personalizado.

Para obter melhores resultados, crie pequenos vocabulários personalizados separados para ajudar a transcrever uma gravação de áudio específica. Você obtém melhorias mais significativas na precisão da transcrição do que se tivesse criado um vocabulário personalizado extenso para usar com todas as gravações.

Por padrão, você pode ter até 100 vocabulários personalizados em seu Conta da AWS. Um vocabulário personalizado não pode exceder 50 KB de tamanho. Para obter informações sobre como solicitar um aumento no número de vocabulários personalizados que você pode ter em seu Conta da AWS, consulte cotas de [AWS serviço](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).

Os vocabulários personalizados estão disponíveis em inglês dos EUA (en-US).

**Topics**
+ [Criar um arquivo de texto para um vocabulário médico personalizado](create-med-vocab-text.md)
+ [Usar um arquivo de texto para criar um vocabulário médico personalizado](create-med-custom-vocabulary.md)
+ [Transcrever um arquivo de áudio usando um vocabulário médico personalizado](start-med-custom-vocab-job.md)
+ [Transcrever um fluxo em tempo real usando um vocabulário médico personalizado](start-med-vocab-stream.md)
+ [Conjunto de caracteres para Amazon Transcribe Medicina](charsets-med.md)

# Criar um arquivo de texto para um vocabulário médico personalizado
<a name="create-med-vocab-text"></a>

Para criar um vocabulário personalizado, você cria um arquivo de texto no formato UTF-8. Nesse arquivo, você cria uma tabela de quatro colunas, cada uma especificando um campo. Cada campo informa ao Amazon Transcribe Medical como os termos específicos do domínio são pronunciados ou como exibi-los em suas transcrições. Você armazena o arquivo de texto contendo esses campos em um bucket do Amazon S3 .

## Como formatar seu arquivo de texto
<a name="understand-vocab-formatting"></a>

Para criar um vocabulário médico personalizado, você insere os nomes das colunas como uma linha de cabeçalho. Você insere os valores de cada coluna abaixo da linha do cabeçalho.

Veja os nomes das quatro colunas da tabela:
+  `Phrase`: coluna obrigatória, valores obrigatórios 
+  `IPA`: coluna obrigatória, os valores podem ser opcionais. 
+  `SoundsLike`: coluna obrigatória, os valores podem ser opcionais. 
+  `DisplayAs`: coluna obrigatória, os valores podem ser opcionais. 

Ao criar um vocabulário personalizado, você deve:
+ Separe cada coluna com um único caractere Tab. Amazon Transcribe lançará uma mensagem de erro se você tentar separar as colunas com espaços ou vários caracteres Tab.
+ Garantir que não haja espaços à direita ou espaços em branco após cada valor em uma coluna.

Garanta que os valores inseridos para cada coluna:
+ Tenham menos de 256 caracteres, incluindo hifens
+ Usem somente caracteres do conjunto de caracteres permitido. Consulte [Conjunto de caracteres para Amazon Transcribe Medicina](charsets-med.md).

## Inserir valores para as colunas da tabela
<a name="entering-vocabulary-values-med"></a>

As seguintes informações mostram como especificar valores para as quatro colunas da tabela:
+ `Phrase`: a palavra ou frase que deve ser reconhecida. Você deve inserir valores nesta coluna.

  Se a entrada for uma frase, separe as palavras com um hífen (-). Por exemplo, insira **cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy** como **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy**.

  Insira os acrônimos ou outras palavras cujas letras devem ser pronunciadas individualmente como letras únicas seguidas por pontos, como **D.N.A.** ou **S.T.E.M.I.**. Para inserir a forma plural de um acrônimo, como "STEMIs”, separe o “s” do acrônimo com um hífen: "**S.T.E.M.I-s**" Você pode usar letras maiúsculas ou minúsculas para acrônimos.

  A coluna `Phrase` é obrigatória. Você pode usar qualquer um dos caracteres permitidos para o idioma de entrada. Para caracteres permitidos, consulte [Conjunto de caracteres para Amazon Transcribe Medicina](charsets-med.md). Se você não especificar a `DisplayAs` coluna, o Amazon Transcribe Medical usará o conteúdo da `Phrase` coluna no arquivo de saída.
+ `IPA` (coluna obrigatória, os valores podem ser opcionais): para especificar a pronúncia de uma palavra ou frase, você pode incluir caracteres do [Alfabeto Fonético Internacional (IPA)](https://en.wikipedia.org/wiki/International_Phonetic_Alphabet) nessa coluna. A coluna `IPA` não pode conter espaços no início nem no final, e você deve usar um único espaço para separar cada fonema na entrada. Por exemplo, em inglês, a expressão **acute-respiratory-distress-syndrome** seria inserida como **ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m**. A expressão **A.L.L.** seria inserida como **eɪ ɛ l ɛ l**.

  Mesmo que não especifique o conteúdo da coluna `IPA`, você deve incluir uma coluna `IPA` em branco. Se você incluir valores na coluna `IPA`, não poderá fornecer valores para a coluna `SoundsLike`.

  Para obter uma lista de caracteres IPA permitidos para um idioma específico, consulte [Conjunto de caracteres para Amazon Transcribe Medicina](charsets-med.md). O inglês americano é o único idioma disponível em Amazon Transcribe Medicina.
+ `SoundsLike` (coluna obrigatória, os valores podem ser opcionais): você pode dividir uma palavra ou frase em segmentos menores e fornecer uma pronúncia para cada segmento usando a ortografia padrão do idioma para imitar o som da palavra. Por exemplo, em inglês, você pode fornecer dicas de pronúncia para a expressão **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** desta forma: **sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy**. A dica para a expressão **atrioventricular-nodal-reentrant-tachycardia** seria assim: **ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia**. Você separa cada parte da dica com um hífen (-). 

  Mesmo que não forneça valores para a coluna `SoundsLike`, você deve incluir uma coluna `SoundsLike` em branco. Se você incluir valores na coluna `SoundsLike`, não poderá fornecer valores para a coluna `IPA`. 

  Você pode usar qualquer um dos caracteres permitidos para o idioma de entrada. Para obter uma lista de caracteres permitidos, consulte [Conjunto de caracteres para Amazon Transcribe Medicina](charsets-med.md).
+ `DisplayAs` (coluna obrigatória, os valores podem ser opcionais): define a aparência da palavra ou frase na saída. Por exemplo, se a palavra ou expressão for **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy**, você poderá especificar a forma de exibição como `cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy`, para que o hífen não esteja presente. Você também poderá especificar `DisplayAs` como `CADASIL` se desejar mostrar o acrônimo em vez do termo completo na saída.

  Se você não especificar a `DisplayAs` coluna, o Amazon Transcribe Medical usará a `Phrase` coluna do arquivo de entrada na saída.

  Você pode usar qualquer caractere UTF-8 na coluna `DisplayAs`.

Você pode incluir espaços apenas para os valores nas colunas `IPA` e `DisplayAs`.

Para criar o arquivo de texto do vocabulário personalizado, coloque cada palavra ou frase no arquivo de texto em uma linha separada. Separe as colunas com caracteres de tabulação. Inclua espaços somente para valores nas colunas `IPA` e `DisplayAs`. Salve o arquivo com a extensão `.txt` em um Amazon S3 bucket no mesmo Região da AWS local em que você usa o Amazon Transcribe Medical para criar seu vocabulário personalizado.

Se você editar o arquivo de texto no Windows, certifique-se de que seu arquivo esteja no formato `LF` e não no formato `CRLF`. Caso contrário, você não poderá criar seu vocabulário personalizado. Alguns editores de texto permitem alterar a formatação com os comandos Find (Localizar) e Replace (Substituir).

Os exemplos a seguir mostram o texto que você pode usar para criar vocabulários personalizados. Para criar um vocabulário personalizado a partir destes exemplos, copie um exemplo em um editor de texto, substitua `[TAB]` por um caractere de tabulação e carregue o arquivo de texto salvo no Amazon S3.

```
Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]
```

Você pode inserir colunas em qualquer ordem. Os exemplos a seguir mostram outras estruturas válidas para o arquivo de entrada de vocabulário personalizado.

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
```

```
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase
acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome
ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L.
[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia
```

Para facilitar a leitura, as tabelas a seguir mostram os exemplos anteriores mais claramente no formato html. O objetivo é apenas ilustrar os exemplos.


| Phrase | IPA | SoundsLike | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| A.L.L. | eɪ ɛ l ɛ l |  | ALL | 
| atrioventricular-nodal-reentrant-tachycardia |  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | 


| Phrase | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  |  | 
| A.L.L. |  | eɪ ɛ l ɛ l | ALL | 


| DisplayAs | SoundsLike | IPA | Phrase | 
| --- | --- | --- | --- | 
| acute respiratory distress syndrome |  |  | acute-respiratory-distress-syndrome | 
| ALL |  | eɪ ɛ l ɛ l | A.L.L. | 
|  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | atrioventricular-nodal-reentrant-tachycardia | 

# Usar um arquivo de texto para criar um vocabulário médico personalizado
<a name="create-med-custom-vocabulary"></a>

Para criar um vocabulário personalizado, você deve ter preparado um arquivo de texto que contenha uma coleção de palavras ou frases. Amazon Transcribe O Medical usa esse arquivo de texto para criar um vocabulário personalizado que você pode usar para melhorar a precisão da transcrição dessas palavras ou frases. Você pode criar um vocabulário personalizado usando a [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html)API ou o console Amazon Transcribe médico.

## Console de gerenciamento da AWS
<a name="create-med-custom-vocab-console"></a>

Para usar o Console de gerenciamento da AWS para criar um vocabulário personalizado, você fornece o Amazon S3 URI do arquivo de texto contendo suas palavras ou frases.

1. Faça login no [Console de gerenciamento da AWS](https://console.aws.amazon.com/transcribe/).

1. No painel de navegação, em Amazon Transcribe Médico, escolha **Vocabulário personalizado**.

1. Em **Nome**, em **Configurações de vocabulário**, escolha um nome para o vocabulário personalizado.

1. Especifique a localização do arquivo de áudio ou arquivo de vídeo no Amazon S3:
   + Em **Local do arquivo de entrada de vocabulário no S3**, em **Configurações de vocabulário**, especifique o URI do Amazon S3 que identifica o arquivo de texto que você usará para criar o vocabulário personalizado.
   + Em **Local do arquivo de entrada de vocabulário no S3**, escolha **Procurar no S3** para procurar o arquivo de texto e escolhê-lo.

1. Selecione **Criar vocabulário**.

Você pode ver o status de processamento do vocabulário personalizado no Console de gerenciamento da AWS.

## solicitações de
<a name="create-med-custom-vocab-api"></a>

**Como criar um vocabulário médico personalizado (API)**
+ Para a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html), especifique o seguinte.

  1. Em `LanguageCode`, especifique `en-US`.

  1. Para`VocabularyFileUri`, especifique a Amazon S3 localização do arquivo de texto que você usa para definir seu vocabulário personalizado.

  1. Em `VocabularyName`, especifique um nome para o vocabulário personalizado. O nome que você especificar deve ser exclusivo em seu Conta da AWS.

Para ver o status de processamento do vocabulário personalizado, use a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetMedicalVocabulary.html).

Veja a seguir um exemplo de solicitação usando o AWS SDK para Python (Boto3) para criar um vocabulário personalizado.

```
from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## AWS CLI
<a name="create-med-custom-vocab-cli"></a>

**Como habilitar a separação de oradores (locutores) em um trabalho de transcrição em lote (AWS CLI)**
+ Execute o código a seguir.

  ```
  aws transcribe create-medical-vocabulary \
  --vocabulary-name my-first-vocabulary \ 
  --vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
  --language-code en-US
  ```

# Transcrever um arquivo de áudio usando um vocabulário médico personalizado
<a name="start-med-custom-vocab-job"></a>

Use o [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html)ou o Console de gerenciamento da AWS para iniciar um trabalho de transcrição que usa um vocabulário personalizado para melhorar a precisão da transcrição.

## Console de gerenciamento da AWS
<a name="start-med-custom-vocab-job-console"></a>

1. Faça login no [Console de gerenciamento da AWS](https://console.aws.amazon.com/transcribe/).

1. No painel de navegação, em Amazon Transcribe Medicina, escolha Trabalhos de **transcrição**.

1. Escolha **Criar trabalho**.

1. Na página **Especificar os detalhes da tarefa**, forneça informações sobre o trabalho de transcrição.

1. Escolha **Próximo**.

1. Em **Personalização**, habilite **Vocabulário personalizado**.

1. Em **Seleção de vocabulário**, escolha um vocabulário personalizado.

1. Escolha **Criar**.

## solicitações de
<a name="start-med-custom-vocab-api"></a>

**Como habilitar a separação de locutores em um arquivo de áudio usando um trabalho de transcrição em lote (API)**
+ Para a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), especifique o seguinte.

  1. Para `MedicalTranscriptionJobName`, especifique um nome que seja exclusivo em sua Conta da AWS.

  1. Em `LanguageCode`, especifique o código do idioma falado no arquivo de mídia e o idioma do filtro de vocabulário.

  1. Para o parâmetro `MediaFileUri` do objeto `Media`, especifique o nome do arquivo de áudio que você deseja transcrever.

  1. Em `Specialty`, indique a especialidade médica do médico que está se pronunciando no arquivo de áudio.

  1. Em `Type`, especifique se o arquivo de áudio é uma conversa ou um ditado.

  1. Em `OutputBucketName`, especifique o bucket do Amazon S3 para armazenar os resultados da transcrição.

  1. Para o objeto `Settings`, especifique o seguinte:

     1. `VocabularyName`: o nome do vocabulário personalizado.

A solicitação a seguir usa o AWS SDK para Python (Boto3) para iniciar um trabalho de transcrição em lote com um vocabulário personalizado.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-med-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
   MedicalTranscriptionJobName = job_name,
   Media = {
       'MediaFileUri': job_uri
   },
   OutputBucketName = 'amzn-s3-demo-bucket',
   OutputKey = 'my-output-files/', 
   LanguageCode = 'en-US',
   Specialty = 'PRIMARYCARE',
   Type = 'CONVERSATION',
   Settings = {
       'VocabularyName': 'example-med-custom-vocab'
       }
 )

while True:
   status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
   if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

# Transcrever um fluxo em tempo real usando um vocabulário médico personalizado
<a name="start-med-vocab-stream"></a>

Para melhorar a precisão da transcrição em um stream em tempo real, você pode usar um vocabulário personalizado usando HTTP/2 ou streams. WebSocket Para iniciar uma solicitação HTTP/2, use a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html). Você pode usar um vocabulário personalizado em tempo real usando a [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API ou usando o WebSocket protocolo. Console de gerenciamento da AWS

## Transcrever um ditado proferido por meio do microfone (Console de gerenciamento da AWS)
<a name="streaming-medical-vocabulary-console"></a>

Para usar o Console de gerenciamento da AWS para transcrever o streaming de áudio de um ditado médico, escolha a opção de transcrever um ditado médico, iniciar a transmissão e começar a falar no microfone.

**Como transcrever o streaming de áudio de um ditado médico (Console de gerenciamento da AWS)**

1. Faça login no [Console de gerenciamento da AWS](https://console.aws.amazon.com/transcribe/).

1. No painel de navegação, em Amazon Transcribe Médico, escolha **Transcrição em tempo real**.

1. Em **Especialidade médica**, escolha a especialidade médica do médico que está se pronunciando no fluxo.

1. Em **Tipo de entrada de áudio**, escolha **Conversa** ou **Ditado**.

1. Em **Configurações adicionais**, escolha **Vocabulário personalizado**.

   1. Em **Seleção de vocabulário**, escolha o vocabulário personalizado.

1. Selecione **Start streaming** (Iniciar transmissão).

1. Fale pelo microfone.

## Habilitar a separação de locutores em um fluxo HTTP/2
<a name="vocabulary-med-http2"></a>

Veja a seguir a sintaxe dos parâmetros de uma solicitação HTTP/2.

```
POST /medical-stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
authorization: Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription
x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date: 20220208T235959Z
x-amzn-transcribe-session-id: my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-med-vocab
x-amzn-transcribe-specialty: PRIMARYCARE
x-amzn-transcribe-type: CONVERSATION
x-amzn-transcribe-show-speaker-label: true
Content-type: application/vnd.amazon.eventstream
transfer-encoding: chunked
```

Descrições dos parâmetros:
+ **host**: atualize o Região da AWS ('us-west-2' no exemplo anterior) com Região da AWS o que você está chamando. Para obter uma lista de pontos finais válidos Regiões da AWS, consulte [Regiões da AWS Endpoints](https://docs.aws.amazon.com/general/latest/gr/rande.html#transcribe_region).
+ **authorization**: esse é um campo gerado. Para saber mais sobre como criar uma assinatura, consulte [Assinando AWS solicitações com o Signature versão 4](https://docs.aws.amazon.com/general/latest/gr/sigv4_signing.html).
+ **x-amz-target**: não altere esse campo; use o conteúdo mostrado no exemplo anterior.
+ **x-amz-content-sha256**: Esse é um campo gerado. Para saber mais sobre o cálculo de uma assinatura, consulte [Assinando AWS solicitações com o Signature versão 4](https://docs.aws.amazon.com/general/latest/gr/sigv4_signing.html).
+ **x-amz-date**: a data e a hora em que a assinatura foi criada. O formato é YYYYMMDDTHHMMSSZ, onde YYYY = ano, mm = mês, DD = dia, HH = hora, MM = minuto, SS = segundos e “T” e “Z” são caracteres fixos. Para obter mais informações, consulte [Handling Dates in Signature Version 4](https://docs.aws.amazon.com/general/latest/gr/sigv4-date-handling.html).
+ **x-amzn-transcribe-session-id**: o nome da sua sessão de streaming.
+ **x-amzn-transcribe-language-code**: a codificação usada para o áudio de entrada. Consulte [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) ou [Idiomas oferecidos e recursos específicos do idioma](supported-languages.md) para obter uma lista de valores válidos.
+ **x-amzn-transcribe-media-encoding**: a codificação usada para o áudio de entrada. Os valores válidos são `pcm`, `ogg-opus` e `flac`.
+ **x-amzn-transcribe-sample-rate**: A taxa de amostragem do áudio de entrada (em Hertz). Amazon Transcribe suporta uma faixa de 8.000 Hz a 48.000 Hz. O áudio de baixa qualidade, como o áudio telefônico, normalmente gira em torno de 8.000 Hz. Áudio de alta qualidade normalmente varia de 16.000 Hz a 48.000 Hz. Observe que a taxa de amostragem especificada **deve** corresponder à do áudio.
+ **x-amzn-transcribe-vocabulary-name**: o nome do vocabulário que você deseja usar com sua transcrição.
+ **x-amzn-transcribe-specialty**: A especialidade médica que está sendo transcrita.
+ **x-amzn-transcribe-type**: escolha se isso é um ditado ou uma conversa.
+ **x-amzn-transcribe-show-speaker-label**: para habilitar a diarização, esse valor deve ser. `true`
+ **content-type**: não altere esse campo; use o conteúdo mostrado no exemplo anterior.

## Ativando o particionamento de alto-falantes em uma solicitação WebSocket
<a name="vocabulary-websocket"></a>

Para particionar alto-falantes em WebSocket streams com a API, use o formato a seguir para criar um URI pré-assinado para iniciar uma WebSocket solicitação e `vocabulary-name` definir o nome do vocabulário personalizado. 

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=en-US
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean
```

# Conjunto de caracteres para Amazon Transcribe Medicina
<a name="charsets-med"></a>

Para usar vocabulários personalizados em Amazon Transcribe Medicina, use o seguinte conjunto de caracteres.

## Conjunto de caracteres em inglês
<a name="char-english-med"></a>

Para vocabulários personalizados em inglês, você pode usar os seguintes caracteres nas colunas `Phrase` e `SoundsLike`:
+ a - z
+ A - Z
+ ' (apóstrofo)
+ - (hífen)
+ . (ponto final)

Você pode usar os caracteres do Alfabeto Fonético Internacional (IPA) a seguir no campo `IPA` do arquivo de entrada de vocabulário:


| Caractere | Código | Caractere | Código | 
| --- | --- | --- | --- | 
| aʊ | 0061 028A | w | 0077 | 
| aɪ | 0061 026A | z | 007A | 
| b | 0062 | æ | 00E6 | 
| d | 0064 | ð | 00F0 | 
| eɪ | 0065 026A | ŋ | 014B | 
| f | 0066 | ɑ | 0251 | 
| g | 0067 | ɔ | 0254 | 
| h | 0068 | ɔɪ | 0254 026A | 
| i | 0069 | ə | 0259 | 
| j | 006A | ɛ | 025B | 
| k | 006B | ɝ | 025D | 
| l | 006C | ɡ | 0261 | 
| l̩ | 006C 0329 | ɪ | 026A | 
| m | 006D | ɹ | 0279 | 
| n | 006E | ʃ | 0283 | 
| n̩ | 006E 0329 | ʊ | 028A | 
| oʊ | 006F 028A | ʌ | 028C | 
| p | 0070 | ʍ | 028D | 
| s | 0073 | ʒ | 0292 | 
| t | 0074 | ʤ | 02A4 | 
| u | 0075 | ʧ | 02A7 | 
| v | 0076 | θ | 03B8 | 