

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Transcrever uma conversa médica
<a name="transcribe-medical-conversation"></a>

Você pode usar o Amazon Transcribe Medical para transcrever uma conversa médica entre um médico e um paciente usando um trabalho de transcrição em lote ou uma transmissão em tempo real. Os trabalhos de transcrição em lote permitem que você transcreva arquivos de áudio. Para garantir que o Amazon Transcribe Medical produza resultados de transcrição com a maior precisão possível, você deve especificar a especialidade médica do médico em seu trabalho ou stream de transcrição.

Você pode transcrever uma consulta médico-paciente nas seguintes especialidades médicas:
+ Cardiologia: disponível somente em transcrição de streaming.
+ Neurologia: disponível somente em transcrição de streaming.
+ Oncologia: disponível somente em transcrição de streaming.
+ Atenção primária, que inclui os seguintes tipos de prática médica:
  + Medicina de família
  + Medicina interna
  + Obstetrícia e ginecologia (OB-GYN)
  + Pediatria
+ Urologia: disponível apenas em transcrição de streaming.

Você pode melhorar a precisão da transcrição usando vocabulários médicos personalizados. Para obter informações sobre como funcionam os vocabulários médicos personalizados, consulte [Melhorar a precisão da transcrição com vocabulários médicos personalizados](vocabulary-med.md).

Por padrão, o Amazon Transcribe Medical retorna a transcrição com o maior nível de confiança. Se você quiser configurá-lo para retornar transcrições alternativas, consulte [Gerar transcrições alternativas](alternative-med-transcriptions.md).

Para obter informações sobre como os números e as medidas médicas aparecem na saída da transcrição, consulte [Transcrever números](how-numbers-med.md) e [Transcrever medidas e termos médicos](how-measurements-med.md).

**Topics**
+ [Transcrever um arquivo de áudio de uma conversa médica](batch-medical-conversation.md)
+ [Transcrever uma conversa médica em um fluxo em tempo real](streaming-medical-conversation.md)
+ [Habilitar a separação de locutores](conversation-diarization-med.md)
+ [Transcrever áudio multicanal](conversation-channel-id-med.md)

# Transcrever um arquivo de áudio de uma conversa médica
<a name="batch-medical-conversation"></a>

Use um trabalho de transcrição em lote para transcrever arquivos de áudio de conversas médicas. Você pode usar isso para transcrever um diálogo entre médico e paciente. Você pode iniciar um trabalho de transcrição em lote na API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) ou no Console de gerenciamento da AWS.

Ao iniciar um trabalho de transcrição médica com a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), você especifica `PRIMARYCARE` como o valor do parâmetro `Specialty`. 

## Console de gerenciamento da AWS
<a name="batch-med-conversation-console"></a>

**Transcrever um diálogo entre médico e paciente (Console de gerenciamento da AWS)**

****Para usar o Console de gerenciamento da AWS para transcrever um diálogo médico-paciente, crie um trabalho de transcrição e escolha Conversação como tipo de entrada de áudio.****

1. Faça login no [Console de gerenciamento da AWS](https://console.aws.amazon.com/transcribe/).

1. No painel de navegação, em Amazon Transcribe Medicina, escolha Trabalhos de **transcrição**.

1. Escolha **Criar trabalho**.

1. Na página **Especificar os detalhes da tarefa**, em **Configurações de tarefa**, especifique as configurações a seguir.

   1. **Nome**: o nome do trabalho de transcrição.

   1. **Tipo de entrada de áudio**: **Conversa**

1. Para os campos restantes, especifique a Amazon S3 localização do seu arquivo de áudio e onde você deseja armazenar a saída do seu trabalho de transcrição.

1. Escolha **Próximo**.

1. Escolha **Criar**.

## solicitações de
<a name="batch-med-conversation-api"></a>

**Como transcrever uma conversa médica usando um trabalho de transcrição em lote (API)**
+ Para a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), especifique o seguinte.

  1. Para `MedicalTranscriptionJobName`, especifique um nome exclusivo em sua Conta da AWS.

  1. Em `LanguageCode`, especifique o código do idioma falado no arquivo de mídia e o idioma do filtro de vocabulário.

  1. Para o parâmetro `MediaFileUri` do objeto `Media`, especifique o nome do arquivo de áudio que você deseja transcrever.

  1. Para `Specialty`, especifique a especialidade médica do médico que está se pronunciando no arquivo de áudio como `PRIMARYCARE`.

  1. Em `Type`, especifique `CONVERSATION`.

  1. Em `OutputBucketName`, especifique o bucket do Amazon S3 para armazenar os resultados da transcrição.

  A seguir está um exemplo de solicitação que usa o AWS SDK para Python (Boto3) para transcrever uma conversa médica entre um médico da `PRIMARYCARE` especialidade e um paciente.

  ```
  from __future__ import print_function
  import time
  import boto3
  transcribe = boto3.client('transcribe', 'us-west-2')
  job_name = "my-first-med-transcription-job"
  job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
  transcribe.start_medical_transcription_job(
        MedicalTranscriptionJobName = job_name,
        Media = {
          'MediaFileUri': job_uri
        },
        OutputBucketName = 'amzn-s3-demo-bucket',
        OutputKey = 'output-files/',
        LanguageCode = 'en-US',
        Specialty = 'PRIMARYCARE',
        Type = 'CONVERSATION'
    )
  
  while True:
      status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
      if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
          break
      print("Not ready yet...")
      time.sleep(5)
  print(status)
  ```

O código de exemplo a seguir mostra os resultados da transcrição de uma conversa entre médico e paciente.

```
{
    "jobName": "conversation-medical-transcription-job",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "... come for a follow up visit today..."
            }
        ],
        "items": [
            {
            ...
                "start_time": "4.85",
                "end_time": "5.12",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "come"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.12",
                "end_time": "5.29",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "for"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.29",
                "end_time": "5.33",
                "alternatives": [
                    {
                        "confidence": "0.9955",
                        "content": "a"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.33",
                "end_time": "5.66",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "follow"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.66",
                "end_time": "5.75",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "up"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.75",
                "end_time": "6.02",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "visit"
                    }
                ]
                ...
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="batch-med-conversation-cli"></a>

**Como transcrever uma conversa médica usando um trabalho de transcrição em lote (AWS CLI)**
+ Execute o código a seguir.

  ```
                      
  aws transcribe start-medical-transcription-job \
  --region us-west-2 \
  --cli-input-json file://example-start-command.json
  ```

  O código a seguir mostra o conteúdo de `example-start-command.json`.

  ```
  {
        "MedicalTranscriptionJobName": "my-first-med-transcription-job",        
        "Media": {
            "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
        },
        "OutputBucketName": "amzn-s3-demo-bucket",
        "OutputKey": "my-output-files/", 
        "LanguageCode": "en-US",
        "Specialty": "PRIMARYCARE",
        "Type": "CONVERSATION"
    }
  ```

# Transcrever uma conversa médica em um fluxo em tempo real
<a name="streaming-medical-conversation"></a>

Você pode transcrever um stream de áudio de uma conversa médica usando o HTTP/2 ou os protocolos. [WebSocket ](https://tools.ietf.org/html/rfc6455) Para obter informações sobre como iniciar um stream usando o WebSocket protocolo, consulte[Configurando um WebSocket stream](streaming-setting-up.md#streaming-websocket). Para iniciar um fluxo HTTP/2, use a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html).

Você pode transcrever o áudio de streaming nas seguintes especialidades médicas:
+ Cardiologia
+ Neurologia
+ Oncologia
+ Atenção primária
+ Urologia

Cada especialidade médica inclui vários tipos de procedimentos e consultas. Portanto, os médicos ditam vários tipos diferentes de notas. Use os exemplos a seguir como orientação para ajudá-lo a especificar o valor do parâmetro `specialty` URI da WebSocket solicitação ou o `Specialty` parâmetro da [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API:
+ Para consultas de eletrofisiologia ou ecocardiografia, escolha `CARDIOLOGY`.
+ Para consultas de oncologia médica, oncologia cirúrgica ou oncologia por radiação, escolha `ONCOLOGY`.
+ Para um médico em consulta a um paciente que teve derrame, seja um ataque isquêmico transitório ou um ataque cerebrovascular, escolha `NEUROLOGY`.
+ Para uma consulta sobre incontinência urinária, escolha `UROLOGY`.
+ Para exames anuais ou consultas de atendimento urgente, escolha `PRIMARYCARE`.
+ Para consultas hospitalares com pacientes internados, escolha `PRIMARYCARE`.
+ Para consultas sobre fertilidade, laqueadura tubária, inserção de DIU ou aborto, escolha `PRIMARYCARE`.

## Console de gerenciamento da AWS
<a name="streaming-medical-conversation-console"></a>

**Como transcrever um streaming de conversa médica (Console de gerenciamento da AWS)**

Para usar o Console de gerenciamento da AWS para transcrever um diálogo médico-paciente em uma transmissão em tempo real, escolha a opção de transcrever uma conversa médica, iniciar a transmissão e começar a falar no microfone.

1. Faça login no [Console de gerenciamento da AWS](https://console.aws.amazon.com/transcribe/).

1. No painel de navegação, em Amazon Transcribe Médico, escolha **Transcrição em tempo real**.

1. Escolha **Conversa**.

1. Em **Especialidade médica**, escolha a especialidade do médico.

1. Selecione **Start streaming** (Iniciar transmissão).

1. Fale pelo microfone.

## Transcrever uma conversa médica em um fluxo HTTP/2
<a name="http2-med-conversation-streaming"></a>

Veja a seguir a sintaxe dos parâmetros de uma solicitação HTTP/2.

Para transcrever um fluxo HTTP/2 de uma conversa médica, use a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) e especifique o seguinte:
+ `LanguageCode`: o código do idioma. O valor válido é `en-US`.
+ `MediaEncoding`: a codificação usada para o áudio de entrada. Os valores válidos são `pcm`, `ogg-opus` e `flac`.
+ `Specialty`: a especialidade do profissional médico.
+ `Type` – `CONVERSATION`

Para melhorar a precisão da transcrição de termos específicos em um fluxo em tempo real, use um vocabulário personalizado. Para habilitar um vocabulário personalizado, defina o valor do parâmetro `VocabularyName` como o nome do vocabulário personalizado que você deseja usar. Para obter mais informações, consulte [Melhorar a precisão da transcrição com vocabulários médicos personalizados](vocabulary-med.md).

Para rotular a fala de diferentes locutores, defina o parâmetro `ShowSpeakerLabel` como `true`. Para obter mais informações, consulte [Habilitar a separação de locutores](conversation-diarization-med.md).

Para obter mais informações sobre como configurar um fluxo HTTP/2 para transcrever uma conversa médica, consulte [Configurar um fluxo de HTTP/2](streaming-setting-up.md#streaming-http2).

## Transcrevendo uma conversa médica em um stream WebSocket
<a name="transcribe-medical-conversation-websocket"></a>

Você pode usar uma WebSocket solicitação para transcrever uma conversa médica. Ao fazer uma WebSocket solicitação, você cria um URI pré-assinado. Esse URI contém as informações necessárias para configurar o fluxo de áudio entre a aplicação e o Amazon Transcribe Medical. Para obter mais informações sobre a criação WebSocket de solicitações, consulte[Configurando um WebSocket stream](streaming-setting-up.md#streaming-websocket).

O modelo a seguir pode ser usado para criar seu URI pré-assinado.

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=languageCode
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean
```

Para melhorar a precisão da transcrição de termos específicos em um fluxo em tempo real, use um vocabulário personalizado. Para habilitar um vocabulário personalizado, defina o valor de `vocabulary-name` como o nome do vocabulário personalizado que você deseja usar. Para obter mais informações, consulte [Melhorar a precisão da transcrição com vocabulários médicos personalizados](vocabulary-med.md).

Para rotular a fala de diferentes locutores, defina o parâmetro `show-speaker-label` como `true`. Para obter mais informações, consulte [Habilitar a separação de locutores](conversation-diarization-med.md).

Para obter mais informações sobre a criação de pré-assinados URIs, consulte[Configurando um WebSocket stream](streaming-setting-up.md#streaming-websocket).

# Habilitar a separação de locutores
<a name="conversation-diarization-med"></a>

Para habilitar o particionamento de alto-falantes no Amazon Transcribe Medical, use a diarização de *alto-falantes*. Isso permite que você veja o que o paciente disse e o que o médico disse na saída da transcrição.

Quando você ativa a diarização do alto-falante, o Amazon Transcribe Medical rotula cada *enunciado* do alto-falante com um identificador exclusivo para cada alto-falante. Um *enunciado* é uma unidade de voz no canal de áudio que normalmente é separada de outras falas por um silêncio. Na transcrição em lote, um enunciado do médico poderia receber um rótulo `spk_0` e um enunciado do paciente poderia receber um rótulo `spk_1`.

Se um enunciado de um locutor se sobrepuser a um enunciado de outro locutor, o Amazon Transcribe Medical os ordenará na transcrição com base nas horas de início. As falas que se sobrepõem no áudio de entrada não se sobrepõem na saída da transcrição.

Você pode habilitar a diarização de locutores ao transcrever um arquivo de áudio usando o trabalho de transcrição em lote ou em um fluxo em tempo real.

**Topics**
+ [Habilitar a separação de locutores em transcrições em lote](conversation-diarization-batch-med.md)
+ [Habilitar a separação de locutores em fluxos em tempo real](conversation-diarization-streaming-med.md)

# Habilitar a separação de locutores em transcrições em lote
<a name="conversation-diarization-batch-med"></a>

Você pode habilitar a separação de locutores em um trabalho de transcrição em lote usando a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) ou o Console de gerenciamento da AWS. Isso permite que você divida o texto por locutor em uma conversa entre médico e paciente e determine quem disse o quê na saída da transcrição.

## Console de gerenciamento da AWS
<a name="conversation-diarization-batch-med-console"></a>

Para usar o para habilitar Console de gerenciamento da AWS a diarização do alto-falante em seu trabalho de transcrição, você ativa a identificação de áudio e, em seguida, o particionamento do alto-falante.

1. Faça login no [Console de gerenciamento da AWS](https://console.aws.amazon.com/transcribe/).

1. No painel de navegação, em Amazon Transcribe Medicina, escolha Trabalhos de **transcrição**.

1. Escolha **Criar trabalho**.

1. Na página **Especificar os detalhes da tarefa**, forneça informações sobre o trabalho de transcrição.

1. Escolha **Próximo**.

1. Ative a **Identificação de áudio**.

1. Em **Tipo de identificação de áudio**, escolha **Separação de oradores**.

1. Em **Número máximo de oradores**, insira o número máximo de locutores que você acha que estão falando no arquivo de áudio.

1. Escolha **Criar**.

## solicitações de
<a name="conversation-diarization-batch-med-api"></a>

**Para habilitar a separação de locutores usando um trabalho de transcrição em lote (API)**
+ Para a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), especifique o seguinte.

  1. Para `MedicalTranscriptionJobName`, especifique um nome que seja exclusivo em sua Conta da AWS.

  1. Em `LanguageCode`, especifique o código do idioma que corresponde ao idioma falado no arquivo de áudio.

  1. Para o parâmetro `MediaFileUri` do objeto `Media`, especifique o nome do arquivo de áudio que você deseja transcrever.

  1. Em `Specialty`, indique a especialidade médica do médico que está se pronunciando no arquivo de áudio.

  1. Em `Type`, especifique `CONVERSATION`.

  1. Para`OutputBucketName`, especifique o Amazon S3 bucket para armazenar os resultados da transcrição.

  1. Para o objeto `Settings`, especifique o seguinte:

     1. `ShowSpeakerLabels` – `true`.

     1. `MaxSpeakerLabels`: um número inteiro entre 2 e 10 para indicar o número de locutores que você acha que estão falando no áudio.

A solicitação a seguir usa o AWS SDK para Python (Boto3) para iniciar um trabalho de transcrição em lote do diálogo com o paciente de um clínico primário com o particionamento de alto-falantes ativado.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
    MedicalTranscriptionJobName = job_name,
    Media={
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US',
    Specialty = 'PRIMARYCARE',
    Type = 'CONVERSATION',
    OutputBucketName = 'amzn-s3-demo-bucket',
Settings = {'ShowSpeakerLabels': True,
         'MaxSpeakerLabels': 2
         }
         )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

O código de exemplo a seguir mostra os resultados de um trabalho de transcrição com a separação de locutores habilitada.

```
{
    "jobName": "job ID",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "Professional answer."
            }
        ],
        "speaker_labels": {
            "speakers": 1,
            "segments": [
                {
                    "start_time": "0.000000",
                    "speaker_label": "spk_0",
                    "end_time": "1.430",
                    "items": [
                        {
                            "start_time": "0.100",
                            "speaker_label": "spk_0",
                            "end_time": "0.690"
                        },
                        {
                            "start_time": "0.690",
                            "speaker_label": "spk_0",
                            "end_time": "1.210"
                        }
                    ]
                }
            ]
        },
        "items": [
            {
                "start_time": "0.100",
                "end_time": "0.690",
                "alternatives": [
                    {
                        "confidence": "0.8162",
                        "content": "Professional"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "0.690",
                "end_time": "1.210",
                "alternatives": [
                    {
                        "confidence": "0.9939",
                        "content": "answer"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "alternatives": [
                    {
                        "content": "."
                    }
                ],
                "type": "punctuation"
            }
        ]
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="diarization-batch-cli"></a>

**Como transcrever um arquivo de áudio de uma conversa entre um médico que atua na atenção primária e um paciente (AWS CLI)**
+ Execute o código a seguir.

  ```
                      
  aws transcribe start-transcription-job \
  --region us-west-2 \
  --cli-input-json file://example-start-command.json
  ```

  O código a seguir mostra o conteúdo de `example-start-command.json`.

  ```
  {
      "MedicalTranscriptionJobName": "my-first-med-transcription-job",       
       "Media": {
            "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
        },
        "OutputBucketName": "amzn-s3-demo-bucket",
        "OutputKey": "my-output-files/", 
        "LanguageCode": "en-US",
        "Specialty": "PRIMARYCARE",
        "Type": "CONVERSATION",
        "Settings":{
            "ShowSpeakerLabels": true,
            "MaxSpeakerLabels": 2
          }
  }
  ```

# Habilitar a separação de locutores em fluxos em tempo real
<a name="conversation-diarization-streaming-med"></a>

Para particionar os alto-falantes e rotular sua fala em um stream em tempo real, use o Console de gerenciamento da AWS ou uma solicitação de streaming. A separação de locutores funciona melhor para dois a cinco locutores em um fluxo. Embora o Amazon Transcribe Medical possa particionar mais de cinco alto-falantes em um stream, a precisão das partições diminui se você exceder esse número.

Para iniciar uma solicitação HTTP/2, use a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html). Para iniciar uma WebSocket solicitação, use um URI pré-assinado. O URI contém as informações necessárias para configurar a comunicação bidirecional entre a aplicativo e o Amazon Transcribe Medical.

## Habilitar a separação de locutores no áudio que é transmitido por meio do microfone (Console de gerenciamento da AWS)
<a name="conversation-diarization-console"></a>

Você pode usar o Console de gerenciamento da AWS para iniciar uma transmissão em tempo real de uma conversa médico-paciente ou um ditado que é falado em seu microfone em tempo real.

1. Faça login no [Console de gerenciamento da AWS](https://console.aws.amazon.com/transcribe/).

1. No painel de navegação, para Amazon Transcribe Medicina, escolha **Transcrição em tempo real**.

1. Em **Tipo de entrada de áudio**, escolha o tipo de fala médica que você deseja transcrever.

1. Em **Configurações adicionais**, escolha **Separação de oradores**.

1. Escolha **Iniciar streaming** para começar a transcrever o áudio em tempo real.

1. Fale pelo microfone.

## Habilitar a separação de locutores em um fluxo HTTP/2
<a name="conversation-diarization-med-http2"></a>

Para habilitar a separação de locutores em um fluxo HTTP/2 de uma conversa médica, use a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) e especifique o seguinte: 
+ Em `LanguageCode`, especifique o código do idioma que corresponde ao idioma no fluxo. O valor válido é `en-US`.
+ Em `MediaSampleHertz`, especifique a taxa de amostragem do áudio.
+ Em `Specialty`, especifique a especialidade médica do profissional.
+ `ShowSpeakerLabel` – `true`

Para obter mais informações sobre como configurar um fluxo HTTP/2 para transcrever uma conversa médica, consulte [Configurar um fluxo de HTTP/2](streaming-setting-up.md#streaming-http2).

## Ativando o particionamento de alto-falantes em uma solicitação WebSocket
<a name="conversation-diarization-med-websocket"></a>

Para particionar alto-falantes em WebSocket streams com a API, use o formato a seguir para criar um URI pré-assinado para iniciar uma WebSocket solicitação e definir como`show-speaker-label`. `true` 

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=languageCode
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean
```

O código a seguir mostra o exemplo de resposta truncada de uma solicitação de streaming.

```
{
  "Transcript": {
    "Results": [
      {
        "Alternatives": [
          {
            "Items": [
              {
                "Confidence": 0.97,
                "Content": "From",
                "EndTime": 18.98,
                "Speaker": "0",
                "StartTime": 18.74,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "Confidence": 1,
                "Content": "the",
                "EndTime": 19.31,
                "Speaker": "0",
                "StartTime": 19,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "Confidence": 1,
                "Content": "last",
                "EndTime": 19.86,
                "Speaker": "0",
                "StartTime": 19.32,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
             ...
              {
                "Confidence": 1,
                "Content": "chronic",
                "EndTime": 22.55,
                "Speaker": "0",
                "StartTime": 21.97,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              ...
                "Confidence": 1,
                "Content": "fatigue",
                "EndTime": 24.42,
                "Speaker": "0",
                "StartTime": 23.95,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "EndTime": 25.22,
                "StartTime": 25.22,
                "Type": "speaker-change",
                "VocabularyFilterMatch": false
              },
              {
                "Confidence": 0.99,
                "Content": "True",
                "EndTime": 25.63,
                "Speaker": "1",
                "StartTime": 25.22,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "Content": ".",
                "EndTime": 25.63,
                "StartTime": 25.63,
                "Type": "punctuation",
                "VocabularyFilterMatch": false
              }
            ],
            "Transcript": "From the last note she still has mild sleep deprivation and chronic fatigue True."
          }
        ],
        "EndTime": 25.63,
        "IsPartial": false,
        "ResultId": "XXXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXX",
        "StartTime": 18.74
      }
    ]
  }
}
```

Amazon Transcribe O Medical interrompe o fluxo de áudio de entrada com base em segmentos naturais da fala, como uma mudança no alto-falante ou uma pausa no áudio. A transcrição é retornada progressivamente para seu aplicativo, com cada resposta contendo mais fala transcrita até que todo o segmento seja transcrito. O código anterior é um exemplo truncado de um segmento de fala totalmente transcrito. Os rótulos dos locutores só aparecem para segmentos totalmente transcritos. 

A lista a seguir mostra a organização dos objetos e parâmetros em uma saída de transcrição de streaming.

**`Transcript`**  
Cada segmento de fala tem seu próprio objeto `Transcript`.

**`Results`**  
Cada objeto `Transcript` tem seu próprio objeto `Results`. Esse objeto contém o campo `isPartial`. Quando o valor é `false`, os resultados retornados referem-se a um segmento de fala inteiro.

**`Alternatives`**  
Cada objeto `Results` tem um objeto `Alternatives`.

**`Items`**  
Cada objeto `Alternatives` tem seu próprio objeto `Items`, que contém informações sobre cada palavra e sinal de pontuação na saída da transcrição. Quando você ativa o particionamento do alto-falante, cada palavra tem um `Speaker` rótulo para segmentos de fala totalmente transcritos. Amazon Transcribe O Medical usa esse rótulo para atribuir um número inteiro exclusivo a cada alto-falante no stream. O parâmetro `Type` que o valor `speaker-change` indica que uma pessoa parou de falar e que outra pessoa está prestes a começar.

**`Transcript`**  
Cada objeto Items contém um segmento de fala transcrito como o valor do campo `Transcript`.

Para obter mais informações sobre WebSocket solicitações, consulte[Configurando um WebSocket stream](streaming-setting-up.md#streaming-websocket).

# Transcrever áudio multicanal
<a name="conversation-channel-id-med"></a>

Se você tiver um arquivo ou stream de áudio com vários canais, poderá usar a *identificação do canal* para transcrever a fala de cada um desses canais. Amazon Transcribe O médico transcreve o discurso de cada canal separadamente. Ele combina as transcrições separadas de cada canal em uma única saída de transcrição.

Use a identificação de canal para distinguir os canais separados no áudio e transcrever a fala de cada um deles. Habilite esse recurso em situações que envolvam chamador e atendente. Use-o também para distinguir um chamador de um atendente em gravações ou fluxos das centrais de atendimento que realizam monitoramento de segurança de medicamentos.

Você pode habilitar a identificação de canal para processamento em lote e streaming em tempo real. A lista a seguir descreve como habilitá-lo para cada método.
+ Transcrição em lote — Console de gerenciamento da AWS e API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html)
+ Transcrição de streaming — WebSocket streaming e API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)

## Transcrição de arquivos de áudio multicanal
<a name="conversation-channel-id-med-batch"></a>

Quando você transcreve um arquivo de áudio, o Amazon Transcribe Medical retorna uma lista de *itens* para cada canal. Um item é uma palavra transcrita ou um sinal de pontuação. Cada palavra tem uma hora de início e uma hora de término. Se uma pessoa em um canal falar ao mesmo tempo que uma pessoa em um canal distinto, as horas de início e de término dos itens de cada canal vão se sobrepor enquanto a fala de ambas se sobrepuser.

Por padrão, você pode transcrever arquivos de áudio com dois canais. Você pode solicitar um aumento de cota se precisar transcrever arquivos com mais de dois canais. Para obter mais informações sobre como solicitar um aumento de cota, consulte [AWS service (Serviço da AWS) quotas](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).

Para transcrever áudio multicanal em um trabalho de transcrição em lote, use o ou a Console de gerenciamento da AWS API. [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html)

### Console de gerenciamento da AWS
<a name="channel-id-batch-med-console"></a>

Para usar o Console de gerenciamento da AWS para habilitar a identificação de canais em seu trabalho de transcrição em lote, você ativa a identificação de áudio e, em seguida, a identificação de canais. A identificação do canal é um subconjunto da identificação de áudio no Console de gerenciamento da AWS.

1. Faça login no [Console de gerenciamento da AWS](https://console.aws.amazon.com/transcribe/).

1. No painel de navegação, em Amazon Transcribe Medicina, escolha Trabalhos de **transcrição**.

1. Escolha **Criar trabalho**.

1. Na página **Especificar os detalhes da tarefa**, forneça informações sobre o trabalho de transcrição.

1. Escolha **Próximo**.

1. Ative a **Identificação de áudio**.

1. Em **Tipo de identificação de áudio**, escolha **Identificação de canal**.

1. Escolha **Criar**.

### solicitações de
<a name="channel-id-batch-med-api"></a>

**Como transcrever um arquivo de áudio multicanal (API)**
+ Para a API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), especifique o seguinte.

  1. Em `TranscriptionJobName`, especifique um nome exclusivo para sua Conta da AWS.

  1. Em `LanguageCode`, especifique o código do idioma que corresponde ao idioma falado no arquivo de áudio. O valor válido é `en-US`.

  1. No parâmetro `MediaFileUri` do objeto `Media`, especifique o nome do arquivo de mídia a ser transcrito.

  1. Para o objeto `Settings`, defina `ChannelIdentification` como `true`.

Veja a seguir uma solicitação do AWS SDK para Python (Boto3) de exemplo.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_name = "my-first-med-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
      MedicalTranscriptionJobName = job_name,
      Media = {
        'MediaFileUri': job_uri
      },
      OutputBucketName = 'amzn-s3-demo-bucket',
      OutputKey = 'output-files/',
      LanguageCode = 'en-US',
      Specialty = 'PRIMARYCARE',
      Type = 'CONVERSATION',
      Settings = {
        'ChannelIdentification': True
      }
)
while True:
    status = transcribe.get_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

### AWS CLI
<a name="channel-id-med-cli"></a>

**Como transcrever um arquivo de áudio multicanal usando um trabalho de transcrição em lote (AWS CLI)**
+ Execute o código a seguir.

  ```
                      
  aws transcribe start-medical-transcription-job \
  --region us-west-2 \
  --cli-input-json file://example-start-command.json
  ```

  O código a seguir é do arquivo `example-start-command.json`.

  ```
  {
        "MedicalTranscriptionJobName": "my-first-med-transcription-job",        
        "Media": {
            "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
        },
        "OutputBucketName": "amzn-s3-demo-bucket",
        "OutputKey": "my-output-files/", 
        "LanguageCode": "en-US",
        "Specialty": "PRIMARYCARE",
        "Type": "CONVERSATION",
  
          "Settings":{
            "ChannelIdentification": true
          }
  }
  ```

O código a seguir mostra a saída da transcrição de um arquivo de áudio que tem uma conversa em dois canais.

```
{
  "jobName": "job id",
  "accountId": "111122223333",
  "results": {
    "transcripts": [
      {
        "transcript": "When you try ... It seems to ..."
      }
    ],
    "channel_labels": {
      "channels": [
        {
          "channel_label": "ch_0",
          "items": [
            {
              "start_time": "12.282",
              "end_time": "12.592",
              "alternatives": [
                {
                  "confidence": "1.0000",
                  "content": "When"
                }
              ],
              "type": "pronunciation"
            },
            {
              "start_time": "12.592",
              "end_time": "12.692",
              "alternatives": [
                {
                  "confidence": "0.8787",
                  "content": "you"
                }
              ],
              "type": "pronunciation"
            },
            {
              "start_time": "12.702",
              "end_time": "13.252",
              "alternatives": [
                {
                  "confidence": "0.8318",
                  "content": "try"
                }
              ],
              "type": "pronunciation"
            },
            ...
         ]
      },
      {
          "channel_label": "ch_1",
          "items": [
            {
              "start_time": "12.379",
              "end_time": "12.589",
              "alternatives": [
                {
                  "confidence": "0.5645",
                  "content": "It"
                }
              ],
              "type": "pronunciation"
            },
            {
              "start_time": "12.599",
              "end_time": "12.659",
              "alternatives": [
                {
                  "confidence": "0.2907",
                  "content": "seems"
                }
              ],
              "type": "pronunciation"
            },
            {
              "start_time": "12.669",
              "end_time": "13.029",
              "alternatives": [
                {
                  "confidence": "0.2497",
                  "content": "to"
                }
              ],
              "type": "pronunciation"
            },
            ...
        ]
    }
}
```

## Transcrever fluxos de áudio multicanal
<a name="conversation-channel-id-med-stream"></a>

Você pode transcrever áudio de canais separados em HTTP/2 ou WebSocket streams usando a API. [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)

Por padrão, você pode transcrever transmissões com dois canais. Você pode solicitar um aumento de cota se precisar transcrever transmissões que tenham mais de dois canais. Para obter mais informações sobre como solicitar um aumento de cota, consulte [AWS service quotas](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).

### Transcrever áudio multicanal em um fluxo HTTP/2
<a name="conversation-channel-id-http2"></a>

Para transcrever áudio multicanal em um stream HTTP/2, use a [StartMedicalStreamTranscription](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API e especifique o seguinte:
+ `LanguageCode`: o código de idioma do áudio a ser selecionado. O valor válido é `en-US`.
+ `MediaEncoding`: a codificação do áudio. Os valores válidos são `ogg-opus`, `flac` e `pcm`.
+ `EnableChannelIdentification` – `true`
+ `NumberOfChannels`: o número de canais no streaming de áudio.

Para obter mais informações sobre como configurar um fluxo HTTP/2 para transcrever uma conversa médica, consulte [Configurar um fluxo de HTTP/2](streaming-setting-up.md#streaming-http2).

### Transcrevendo áudio multicanal em um stream WebSocket
<a name="channel-id-med-websocket"></a>

Para particionar alto-falantes em WebSocket streams, use o formato a seguir para criar um URI pré-assinado e iniciar uma WebSocket solicitação. Especifique `enable-channel-identification` como `true` e o número de canais no fluxo em `number-of-channels`. Um URI pré-assinado contém as informações necessárias para configurar a comunicação bidirecional entre seu aplicativo e o Medical. Amazon Transcribe 

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=languageCode
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&enable-channel-identification=true
&number-of-channels=2
```

As definições de parâmetros podem ser encontradas na [Referência da API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html); os parâmetros comuns a todas as operações AWS da API estão listados na seção [Parâmetros comuns](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

Para obter mais informações sobre WebSocket solicitações, consulte[Configurando um WebSocket stream](streaming-setting-up.md#streaming-websocket).

### Saída de streaming multicanal
<a name="streaming-med-output"></a>

A saída de uma transcrição de streaming é a mesma para HTTP/2 e solicitações. WebSocket Veja a seguir um exemplo de saída.

```
{
    "resultId": "XXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXX",
    "startTime": 0.11,
    "endTime": 0.66,
    "isPartial": false,
    "alternatives": [
        {
            "transcript": "Left.",
            "items": [
                {
                    "startTime": 0.11,
                    "endTime": 0.45,
                    "type": "pronunciation",
                    "content": "Left",
                    "vocabularyFilterMatch": false
                },
                {
                    "startTime": 0.45,
                    "endTime": 0.45,
                    "type": "punctuation",
                    "content": ".",
                    "vocabularyFilterMatch": false
                }
            ]
        }
    ],
    "channelId": "ch_0"
}
```

Para cada segmento de fala, há um sinalizador `channelId`, que indica a qual canal a fala pertence.