

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Transcripción de una conversación médica
<a name="transcribe-medical-conversation"></a>

Puede usar Amazon Transcribe Medical para transcribir una conversación médica entre un médico y un paciente mediante un trabajo de transcripción por lotes o una transmisión en tiempo real. Los trabajos de transcripción por lotes le permiten transcribir archivos de audio. Para garantizar que Amazon Transcribe Medical produzca los resultados de la transcripción con la mayor precisión posible, debe especificar la especialidad médica del médico en su trabajo o transmisión de transcripción.

Puede transcribir una visita entre un médico y un paciente en las siguientes especialidades médicas:
+ Cardiología: sólo disponible en streaming con transcripción
+ Cardiología: sólo disponible en transcripción de streaming
+ Cardiología: sólo disponible en transcripción de streaming
+ Atención primaria: incluye los siguientes tipos de práctica médica:
  + Medicina familiar
  + Medicina interna
  + Obstetricia y ginecología (OB-GYN)
  + Pediatría
+ Urología: sólo disponible en streaming con transcripción

Puede mejorar la precisión de la transcripción mediante el uso de vocabularios médicos personalizados. Para obtener información sobre cómo funcionan los vocabularios médicos personalizados, consulte [Mejora de la precisión de la transcripción con vocabularios médicos personalizados](vocabulary-med.md).

De forma predeterminada, Amazon Transcribe Medical devuelve la transcripción con el nivel de confianza más alto. Si desea configurarlo para que devuelva transcripciones alternativas, consulte. [Generar transcripciones alternativas](alternative-med-transcriptions.md)

Para obtener información sobre cómo aparecen los números y las medidas médicas en el resultado de la transcripción, consulte [Transcripción de números](how-numbers-med.md) y [Transcripción de mediciones y términos médicos](how-measurements-med.md).

**Topics**
+ [Transcripción de un archivo de audio de una conversación médica](batch-medical-conversation.md)
+ [Transcribir una conversación médica en una secuencia en tiempo real](streaming-medical-conversation.md)
+ [Habilitar la partición de voces](conversation-diarization-med.md)
+ [Transcripción de audio multicanal](conversation-channel-id-med.md)

# Transcripción de un archivo de audio de una conversación médica
<a name="batch-medical-conversation"></a>

Utilice un trabajo de transcripción por lotes para transcribir archivos de audio de conversaciones médicas. Puede usarlo para transcribir un diálogo entre el médico y el paciente. Puede iniciar un trabajo de transcripción por lotes en la API de [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) o en Consola de administración de AWS.

Al iniciar un trabajo de transcripción médica con la API de [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), debe especificar `PRIMARYCARE` como valor del parámetro `Specialty`. 

## Consola de administración de AWS
<a name="batch-med-conversation-console"></a>

**Para transcribir un diálogo entre el médico y el paciente (Consola de administración de AWS)**

**Para usar el para Consola de administración de AWS transcribir un diálogo entre el médico y el paciente, cree un trabajo de transcripción y seleccione **Conversación** como tipo de entrada de audio.**

1. Inicie sesión en la [Consola de administración de AWS](https://console.aws.amazon.com/transcribe/).

1. **En el panel de navegación, en Amazon Transcribe Medicina, selecciona Trabajos de transcripción.**

1. Seleccione **Crear trabajo**.

1. En la página **Especificar detalles del trabajo**, en **Configuración del trabajo**, especifique lo siguiente.

   1. **Nombre**: el nombre del trabajo de transcripción.

   1. **Tipo de entrada de audio**: **conversación**

1. Para el resto de los campos, especifique la Amazon S3 ubicación del archivo de audio y dónde desea almacenar el resultado del trabajo de transcripción.

1. Elija **Next (Siguiente)**.

1. Seleccione **Crear**.

## API
<a name="batch-med-conversation-api"></a>

**Para transcribir una conversación médica mediante un trabajo de transcripción por lotes (API)**
+ En la API de [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), especifique lo siguiente.

  1. Para `MedicalTranscriptionJobName`, especifique un nombre único en su Cuenta de AWS.

  1. En `LanguageCode`, especifique el código de idioma correspondiente al idioma hablado en el archivo multimedia y el idioma del filtro de vocabulario.

  1. En el parámetro `MediaFileUri` del objeto `Media`, especifique el nombre del archivo multimedia que desea transcribir.

  1. Para `Specialty`, especifique la especialidad médica del profesional que habla en el archivo de audio como`PRIMARYCARE`.

  1. En `Type`, especifique `CONVERSATION`.

  1. Para `OutputBucketName`, especifique el bucket de Amazon S3 en el que se almacenarán los resultados de la transcripción.

  El siguiente es un ejemplo de solicitud que utiliza la AWS SDK para Python (Boto3) para transcribir una conversación médica entre un médico de la `PRIMARYCARE` especialidad y un paciente.

  ```
  from __future__ import print_function
  import time
  import boto3
  transcribe = boto3.client('transcribe', 'us-west-2')
  job_name = "my-first-med-transcription-job"
  job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
  transcribe.start_medical_transcription_job(
        MedicalTranscriptionJobName = job_name,
        Media = {
          'MediaFileUri': job_uri
        },
        OutputBucketName = 'amzn-s3-demo-bucket',
        OutputKey = 'output-files/',
        LanguageCode = 'en-US',
        Specialty = 'PRIMARYCARE',
        Type = 'CONVERSATION'
    )
  
  while True:
      status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
      if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
          break
      print("Not ready yet...")
      time.sleep(5)
  print(status)
  ```

El siguiente código de ejemplo muestra los resultados de la transcripción de una conversación entre el médico y el paciente.

```
{
    "jobName": "conversation-medical-transcription-job",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "... come for a follow up visit today..."
            }
        ],
        "items": [
            {
            ...
                "start_time": "4.85",
                "end_time": "5.12",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "come"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.12",
                "end_time": "5.29",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "for"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.29",
                "end_time": "5.33",
                "alternatives": [
                    {
                        "confidence": "0.9955",
                        "content": "a"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.33",
                "end_time": "5.66",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "follow"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.66",
                "end_time": "5.75",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "up"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.75",
                "end_time": "6.02",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "visit"
                    }
                ]
                ...
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="batch-med-conversation-cli"></a>

**Para transcribir una conversación médica mediante un trabajo de transcripción por lotes (AWS CLI)**
+ Ejecute el siguiente código.

  ```
                      
  aws transcribe start-medical-transcription-job \
  --region us-west-2 \
  --cli-input-json file://example-start-command.json
  ```

  El texto siguiente muestra el contenido de `example-start-command.json`.

  ```
  {
        "MedicalTranscriptionJobName": "my-first-med-transcription-job",        
        "Media": {
            "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
        },
        "OutputBucketName": "amzn-s3-demo-bucket",
        "OutputKey": "my-output-files/", 
        "LanguageCode": "en-US",
        "Specialty": "PRIMARYCARE",
        "Type": "CONVERSATION"
    }
  ```

# Transcribir una conversación médica en una secuencia en tiempo real
<a name="streaming-medical-conversation"></a>

Puede transcribir la transmisión de audio de una conversación médica mediante el HTTP/2 o los protocolos. [WebSocket ](https://tools.ietf.org/html/rfc6455) Para obtener información sobre cómo iniciar una transmisión mediante el WebSocket protocolo, consulte. [Configurar una WebSocket transmisión](streaming-setting-up.md#streaming-websocket) Para iniciar una transmisión HTTP/2, utilice la API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html).

Puede transcribir la transmisión de audio en los siguientes idiomas:
+ Cardiología
+ Neurología
+ Oncología
+ Atención primaria
+ Urología

Cada especialidad médica incluye muchos tipos de procedimientos y consultas. Por lo tanto, los médicos dictan muchos tipos diferentes de notas. Usa los siguientes ejemplos como guía para ayudarte a especificar el valor del parámetro `specialty` URI de la WebSocket solicitud o el `Specialty` parámetro de la [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API:
+ Para consultas de electrofisiología o ecocardiografía, elija `CARDIOLOGY`.
+ Para consultas de oncología médica, oncología quirúrgica u oncología radioterápica, elija `ONCOLOGY`.
+ Para un médico que pasa consulta a un paciente que ha sufrido un accidente cerebrovascular, ya sea un ataque isquémico transitorio o un ataque cerebrovascular, elija `NEUROLOGY`.
+ Para una consulta sobre la incontinencia urinaria, elija `UROLOGY`.
+ Para chequeos anuales o visitas de atención de urgencia, elija `PRIMARYCARE`.
+ Para visitas hospitalarias de pacientes hospitalizados, elija `PRIMARYCARE`.
+ Para consultas relacionadas con la fertilidad, la ligadura de trompas, la inserción de un DIU o el aborto, elija `PRIMARYCARE`.

## Consola de administración de AWS
<a name="streaming-medical-conversation-console"></a>

**Para transcribir una conversación médica en streaming (Consola de administración de AWS)**

Para usar la transmisión Consola de administración de AWS para transcribir un diálogo entre el médico y el paciente en tiempo real, elija la opción de transcribir una conversación médica, inicie la transmisión y comience a hablar por el micrófono.

1. Inicie sesión en la [Consola de administración de AWS](https://console.aws.amazon.com/transcribe/).

1. **En el panel de navegación, en Amazon Transcribe Medicina, selecciona Transcripción en tiempo real.**

1. Elija **Conversación**.

1. Para **Especialidad médica**, elija la especialidad del médico.

1. Elija **Comenzar streaming**.

1. Hable al micrófono.

## Transcribir una conversación médica en una secuencia HTTP/2
<a name="http2-med-conversation-streaming"></a>

A continuación se proporciona la sintaxis de los parámetros de una solicitud HTTP/2.

Para transcribir una secuencia HTTP/2 de una conversación médica, utilice la API de [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) y especifique lo siguiente:
+ `LanguageCode`: código de idioma. El valor válido es `en-US`
+ `MediaEncoding`: codificación utilizada para el audio de entrada. Los valores válidos son `pcm`, `ogg-opus` y `flac`.
+ `Specialty`: especialidad del profesional médico.
+ `Type` – `CONVERSATION`

Para mejorar la precisión de la transcripción de términos específicos en una secuencia en tiempo real, utilice un vocabulario personalizado. Para habilitar un vocabulario personalizado, establezca el valor del parámetro `VocabularyName` en el nombre del vocabulario personalizado que desee usar. Para obtener más información, consulte [Mejora de la precisión de la transcripción con vocabularios médicos personalizados](vocabulary-med.md).

Para etiquetar la voz de distintos hablantes, defina el parámetro `ShowSpeakerLabel` en `true`. Para obtener más información, consulte [Habilitar la partición de voces](conversation-diarization-med.md).

Para obtener más información sobre cómo configurar una secuencia HTTP/2 para transcribir una conversación médica, consulte [Configuración de una secuencia HTTP/2](streaming-setting-up.md#streaming-http2).

## Transcribir una conversación médica en una transmisión WebSocket
<a name="transcribe-medical-conversation-websocket"></a>

Puede utilizar una WebSocket solicitud para transcribir una conversación médica. Cuando realizas una WebSocket solicitud, creas un URI prefirmado. Este URI contiene la información necesaria para configurar la secuencia de audio entre su aplicación y Amazon Transcribe Medical. Para obtener más información sobre la creación de WebSocket solicitudes, consulte[Configurar una WebSocket transmisión](streaming-setting-up.md#streaming-websocket).

Use la siguiente plantilla para crear el URI prefirmado.

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=languageCode
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean
```

Para mejorar la precisión de la transcripción de términos específicos en una secuencia en tiempo real, utilice un vocabulario personalizado. Para habilitar un vocabulario personalizado, establezca el valor de `vocabulary-name` en el nombre del vocabulario personalizado que desee usar. Para obtener más información, consulte [Mejora de la precisión de la transcripción con vocabularios médicos personalizados](vocabulary-med.md).

Para etiquetar el discurso de distintas voces, defina el parámetro `show-speaker-label` en `true`. Para obtener más información, consulte [Habilitar la partición de voces](conversation-diarization-med.md).

Para obtener más información sobre la creación de prefirmados URIs, consulte[Configurar una WebSocket transmisión](streaming-setting-up.md#streaming-websocket).

# Habilitar la partición de voces
<a name="conversation-diarization-med"></a>

*Para habilitar la partición de los altavoces en la versión Amazon Transcribe médica, utilice la diarización de los altavoces.* Esto permite ver lo que dijo el paciente y lo que dijo el médico en el resultado de la transcripción.

Al activar la diarización de los altavoces, Amazon Transcribe Medical etiqueta cada *enunciado* del altavoz con un identificador único para cada altavoz. Un *enunciado* es una unidad de voz en el canal de audio que normalmente está separado de otros enunciados por un silencio. En la transcripción por lotes, un enunciado del médico podría recibir una etiqueta `spk_0` y un enunciado con el que el paciente podría recibir una etiqueta `spk_1`.

Si un enunciado de un hablante se superpone con un enunciado de otro hablante, Amazon Transcribe Medical lo ordenará en la transcripción antes de la hora de inicio. Los enunciados que se solapan en el audio de entrada no se solapan en la salida de la transcripción.

Puede activar la diarización de las voces al transcribir un archivo de audio mediante un trabajo de transcripción por lotes o en una secuencia en tiempo real.

**Topics**
+ [Habilitar la partición de las voces en las transcripciones por lotes](conversation-diarization-batch-med.md)
+ [Habilitar la partición de los hablantes en secuencias en tiempo real](conversation-diarization-streaming-med.md)

# Habilitar la partición de las voces en las transcripciones por lotes
<a name="conversation-diarization-batch-med"></a>

Puede habilitar la partición de las voces en un trabajo de transcripción por lotes mediante la API de [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) o Consola de administración de AWS. Esto le permite dividir el texto por voz en una conversación entre el médico y el paciente y determinar quién dijo qué en el resultado de la transcripción.

## Consola de administración de AWS
<a name="conversation-diarization-batch-med-console"></a>

Para utilizar la Consola de administración de AWS diarización de los altavoces en su trabajo de transcripción, active la identificación del audio y, a continuación, la partición de los altavoces.

1. Inicie sesión en la [Consola de administración de AWS](https://console.aws.amazon.com/transcribe/).

1. **En el panel de navegación, en Amazon Transcribe Medicina, selecciona Trabajos de transcripción.**

1. Seleccione **Crear trabajo**.

1. En la página **Especificar detalles del trabajo**, proporcione información sobre su trabajo de transcripción.

1. Elija **Siguiente**.

1. Habilite **Identificación por audio**.

1. En **Tipo de identificación de audio**, seleccione **Partición de voces**.

1. En **Número máximo de voces**, introduzca el número máximo de voces que cree que están hablando en el archivo de audio.

1. Seleccione **Crear**.

## API
<a name="conversation-diarization-batch-med-api"></a>

**Para habilitar la partición de las voces en un trabajo de transcripción por lotes (API)**
+ Para la API de [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), especifique lo siguiente.

  1. Para`MedicalTranscriptionJobName`, especifique un nombre que sea único en su Cuenta de AWS.

  1. Para `LanguageCode`, especifique el código de idioma que corresponda al idioma hablado en el archivo de audio.

  1. En el parámetro `MediaFileUri` del objeto `Media`, especifique el nombre del archivo multimedia que desea transcribir.

  1. Para `Specialty`, especifique la especialidad médica del profesional que habla en el archivo de audio.

  1. En `Type`, especifique `CONVERSATION`.

  1. Para`OutputBucketName`, especifique el Amazon S3 depósito en el que almacenar los resultados de la transcripción.

  1. En el objeto `Settings`, especifique lo siguiente.

     1. `ShowSpeakerLabels` – `true`.

     1. `MaxSpeakerLabels`: número entero entre 2 y 10 para indicar el número de voces que cree que están hablando en el audio.

La siguiente solicitud utiliza el AWS SDK para Python (Boto3) para iniciar un trabajo de transcripción por lotes de un diálogo entre un paciente y un médico de atención primaria con la partición de altavoces habilitada.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
    MedicalTranscriptionJobName = job_name,
    Media={
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US',
    Specialty = 'PRIMARYCARE',
    Type = 'CONVERSATION',
    OutputBucketName = 'amzn-s3-demo-bucket',
Settings = {'ShowSpeakerLabels': True,
         'MaxSpeakerLabels': 2
         }
         )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

El siguiente código de ejemplo muestra los resultados de la transcripción de un trabajo de transcripción con la partición de las voces habilitada.

```
{
    "jobName": "job ID",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "Professional answer."
            }
        ],
        "speaker_labels": {
            "speakers": 1,
            "segments": [
                {
                    "start_time": "0.000000",
                    "speaker_label": "spk_0",
                    "end_time": "1.430",
                    "items": [
                        {
                            "start_time": "0.100",
                            "speaker_label": "spk_0",
                            "end_time": "0.690"
                        },
                        {
                            "start_time": "0.690",
                            "speaker_label": "spk_0",
                            "end_time": "1.210"
                        }
                    ]
                }
            ]
        },
        "items": [
            {
                "start_time": "0.100",
                "end_time": "0.690",
                "alternatives": [
                    {
                        "confidence": "0.8162",
                        "content": "Professional"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "0.690",
                "end_time": "1.210",
                "alternatives": [
                    {
                        "confidence": "0.9939",
                        "content": "answer"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "alternatives": [
                    {
                        "content": "."
                    }
                ],
                "type": "punctuation"
            }
        ]
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="diarization-batch-cli"></a>

**Para transcribir un archivo de audio de una conversación entre un médico de atención primaria y un paciente (AWS CLI)**
+ Ejecute el siguiente código.

  ```
                      
  aws transcribe start-transcription-job \
  --region us-west-2 \
  --cli-input-json file://example-start-command.json
  ```

  El texto siguiente muestra el contenido de `example-start-command.json`.

  ```
  {
      "MedicalTranscriptionJobName": "my-first-med-transcription-job",       
       "Media": {
            "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
        },
        "OutputBucketName": "amzn-s3-demo-bucket",
        "OutputKey": "my-output-files/", 
        "LanguageCode": "en-US",
        "Specialty": "PRIMARYCARE",
        "Type": "CONVERSATION",
        "Settings":{
            "ShowSpeakerLabels": true,
            "MaxSpeakerLabels": 2
          }
  }
  ```

# Habilitar la partición de los hablantes en secuencias en tiempo real
<a name="conversation-diarization-streaming-med"></a>

Para dividir los altavoces y etiquetar su discurso en una transmisión en tiempo real, utilice la Consola de administración de AWS o una solicitud de transmisión. La partición de las voces funciona mejor con entre dos y cinco hablantes en una transmisión. Aunque Amazon Transcribe Medical puede dividir más de cinco altavoces en una transmisión, la precisión de las particiones disminuye si se supera ese número.

Para iniciar una solicitud HTTP/2, utilice la API de [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html). Para iniciar una WebSocket solicitud, utilice un URI prefirmado. El URI contiene la información necesaria para configurar la comunicación bidireccional entre la aplicación y Amazon Transcribe Medical.

## Habilitar la partición de las voces en el audio que se escucha en el micrófono (Consola de administración de AWS)
<a name="conversation-diarization-console"></a>

Puedes usar el Consola de administración de AWS para iniciar una transmisión en tiempo real de una conversación entre el médico y el paciente, o un dictado que se escucha en el micrófono en tiempo real.

1. Inicie sesión en la [Consola de administración de AWS](https://console.aws.amazon.com/transcribe/).

1. **En el panel de navegación, en Amazon Transcribe Medicina, selecciona Transcripción en tiempo real.**

1. En **Tipo de entrada de audio**, elija el tipo de discurso médico que desee transcribir.

1. En **Ajustes adicionales**, seleccion **Partición de las voces**.

1. Elija **Comenzar streaming** para empezar a transcribir su audio en tiempo real.

1. Hable al micrófono.

## Habilitar la partición de las voces en una secuencia HTTP/2
<a name="conversation-diarization-med-http2"></a>

Para habilitar la partición de las voces en una secuencia HTTP/2 de una conversación médica, utilice la API de [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) y especifique lo siguiente: 
+ Para `LanguageCode`, especifique el código de idioma que corresponda al idioma hablado en la secuencia. El valor válido es `en-US`.
+ Para `MediaSampleHertz`, especifique la frecuencia de muestreo del audio.
+ Para`Specialty`, especifique la especialidad médica del proveedor.
+ `ShowSpeakerLabel` – `true`

Para obtener más información sobre cómo configurar una secuencia HTTP/2 para transcribir una conversación médica, consulte [Configuración de una secuencia HTTP/2](streaming-setting-up.md#streaming-http2).

## Habilitar la partición de los altavoces en una solicitud WebSocket
<a name="conversation-diarization-med-websocket"></a>

Para particionar los altavoces en las WebSocket transmisiones con la API, usa el siguiente formato para crear un URI prefirmado para iniciar una WebSocket solicitud y `show-speaker-label` configurarlo. `true` 

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=languageCode
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean
```

El siguiente código muestra el ejemplo truncado de la respuesta de una solicitud de streaming.

```
{
  "Transcript": {
    "Results": [
      {
        "Alternatives": [
          {
            "Items": [
              {
                "Confidence": 0.97,
                "Content": "From",
                "EndTime": 18.98,
                "Speaker": "0",
                "StartTime": 18.74,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "Confidence": 1,
                "Content": "the",
                "EndTime": 19.31,
                "Speaker": "0",
                "StartTime": 19,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "Confidence": 1,
                "Content": "last",
                "EndTime": 19.86,
                "Speaker": "0",
                "StartTime": 19.32,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
             ...
              {
                "Confidence": 1,
                "Content": "chronic",
                "EndTime": 22.55,
                "Speaker": "0",
                "StartTime": 21.97,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              ...
                "Confidence": 1,
                "Content": "fatigue",
                "EndTime": 24.42,
                "Speaker": "0",
                "StartTime": 23.95,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "EndTime": 25.22,
                "StartTime": 25.22,
                "Type": "speaker-change",
                "VocabularyFilterMatch": false
              },
              {
                "Confidence": 0.99,
                "Content": "True",
                "EndTime": 25.63,
                "Speaker": "1",
                "StartTime": 25.22,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "Content": ".",
                "EndTime": 25.63,
                "StartTime": 25.63,
                "Type": "punctuation",
                "VocabularyFilterMatch": false
              }
            ],
            "Transcript": "From the last note she still has mild sleep deprivation and chronic fatigue True."
          }
        ],
        "EndTime": 25.63,
        "IsPartial": false,
        "ResultId": "XXXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXX",
        "StartTime": 18.74
      }
    ]
  }
}
```

Amazon Transcribe Medical divide la transmisión de audio entrante en función de los segmentos naturales de la voz, como un cambio de altavoz o una pausa en el audio. La transcripción se devuelve progresivamente a la aplicación, y cada respuesta contiene más discurso transcrito hasta que se transcribe el segmento completo. El código anterior es un ejemplo truncado de un segmento de voz completamente transcrito. Las etiquetas de las voces sólo aparecen en los segmentos totalmente transcritos. 

La siguiente lista muestra la organización de los objetos y parámetros en un resultado de una transcripción en streaming.

**`Transcript`**  
Cada segmento de voz tiene su propio objeto `Transcript`.

**`Results`**  
Cada objeto `Transcript` tiene su propio objeto `Results`. Este objeto contiene el subcampo `isPartial`. Si su valor es `false`, los resultados devueltos son para un segmento de voz completo.

**`Alternatives`**  
Cada objeto `Results` tiene un objeto `Alternatives`.

**`Items`**  
Cada objeto `Alternatives` tiene su propio objeto `Items` que contiene información sobre cada palabra y signo de puntuación del resultado de la transcripción. Al activar la partición de los altavoces, cada palabra tiene una `Speaker` etiqueta para los segmentos del discurso completamente transcritos. Amazon Transcribe Medical utiliza esta etiqueta para asignar un número entero único a cada altavoz de la transmisión. El parámetro `Type` que tiene un valor de `speaker-change` indica que una persona ha dejado de hablar y que otra está a punto de empezar.

**`Transcript`**  
Cada objeto de Items contiene un segmento de voz transcrito como valor del campo `Transcript`.

Para obtener más información sobre WebSocket las solicitudes, consulte[Configurar una WebSocket transmisión](streaming-setting-up.md#streaming-websocket).

# Transcripción de audio multicanal
<a name="conversation-channel-id-med"></a>

Si tiene un archivo o una transmisión de audio que tiene varios canales, puede usar la *identificación del canal* para transcribir la voz de cada uno de esos canales. Amazon Transcribe Medical transcribe el discurso de cada canal por separado. Combina las transcripciones independientes de cada canal en una única salida de transcripción.

Utilice la identificación de canales para identificar los distintos canales del audio y transcriba la voz de cada uno de esos canales. Habilite esto en situaciones como la de una persona que llama o un agente. Úselo para distinguir a la persona que llama de un agente en las grabaciones o secuencias de los centros de contacto que realizan la supervisión de la seguridad de los medicamentos.

Puede habilitar la identificación de canales tanto para el procesamiento por lotes como para la transmisión en tiempo real. La siguiente lista describe cómo habilitarla para cada método.
+ Transcripción por lotes Consola de administración de AWS y [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html)API
+ Transcripción en WebSocket streaming: streaming y [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API

## Transcripción de archivos de audio multicanal
<a name="conversation-channel-id-med-batch"></a>

Al transcribir un archivo de audio, Amazon Transcribe Medical devuelve una lista de *elementos* para cada canal. Un elemento es una palabra o un signo de puntuación transcritos. Cada palabra tiene una hora de inicio y una hora de finalización. Si una persona de un canal habla por encima de otra persona de otro canal, las horas de inicio y finalización de los elementos de cada canal se superponen mientras unas personas hablan por encima de las otras.

De forma predeterminada, puede transcribir archivos de audio con dos canales. Puede solicitar un aumento de cuota si necesita transcribir archivos que tengan más de dos canales. Para obtener más información acerca de cómo solicitar un aumento de cuota, consulte [cuotas de Servicio de AWS](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).

Para transcribir audio multicanal en un trabajo de transcripción por lotes, utilice la Consola de administración de AWS o la API. [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html)

### Consola de administración de AWS
<a name="channel-id-batch-med-console"></a>

Para utilizar la Consola de administración de AWS identificación de canales en su trabajo de transcripción por lotes, active la identificación de audio y, a continuación, la identificación de canales. La identificación de canales es un subconjunto de la identificación de audio en. Consola de administración de AWS

1. Inicie sesión en la [Consola de administración de AWS](https://console.aws.amazon.com/transcribe/).

1. En el panel de navegación, en Amazon Transcribe Medicina, seleccione **Trabajos de transcripción**.

1. Seleccione **Crear trabajo**.

1. En la página **Especificar detalles del trabajo**, proporcione información sobre su trabajo de transcripción.

1. Elija **Siguiente**.

1. Habilite **Identificación por audio**.

1. En **Tipo de identificación de audio**, seleccione **Identificación de canal**.

1. Seleccione **Crear**.

### API
<a name="channel-id-batch-med-api"></a>

**Para transcribir un archivo de audio multicanal (API)**
+ Para la API de [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), especifique lo siguiente.

  1. Para `TranscriptionJobName`, especifique un nombre único en su Cuenta de AWS.

  1. Para `LanguageCode`, especifique el código de idioma que corresponda al idioma hablado en el archivo de audio. El valor válido es `en-US`.

  1. Para el parámetro `MediaFileUri` del objeto `Media`, especifique el nombre del archivo multimedia que desea transcribir.

  1. Para el objeto `Settings`, establezca `ChannelIdentification` en `true`.

A continuación, se muestra un ejemplo de solicitud que utiliza AWS SDK para Python (Boto3).

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_name = "my-first-med-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
      MedicalTranscriptionJobName = job_name,
      Media = {
        'MediaFileUri': job_uri
      },
      OutputBucketName = 'amzn-s3-demo-bucket',
      OutputKey = 'output-files/',
      LanguageCode = 'en-US',
      Specialty = 'PRIMARYCARE',
      Type = 'CONVERSATION',
      Settings = {
        'ChannelIdentification': True
      }
)
while True:
    status = transcribe.get_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

### AWS CLI
<a name="channel-id-med-cli"></a>

**Para transcribir audio multicanal en un trabajo de transcripción por lotes (AWS CLI)**
+ Ejecute el siguiente código.

  ```
                      
  aws transcribe start-medical-transcription-job \
  --region us-west-2 \
  --cli-input-json file://example-start-command.json
  ```

  El siguiente es el código de `example-start-command.json`.

  ```
  {
        "MedicalTranscriptionJobName": "my-first-med-transcription-job",        
        "Media": {
            "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
        },
        "OutputBucketName": "amzn-s3-demo-bucket",
        "OutputKey": "my-output-files/", 
        "LanguageCode": "en-US",
        "Specialty": "PRIMARYCARE",
        "Type": "CONVERSATION",
  
          "Settings":{
            "ChannelIdentification": true
          }
  }
  ```

El siguiente código muestra el resultado de la transcripción de un archivo de audio que tiene una conversación en dos canales.

```
{
  "jobName": "job id",
  "accountId": "111122223333",
  "results": {
    "transcripts": [
      {
        "transcript": "When you try ... It seems to ..."
      }
    ],
    "channel_labels": {
      "channels": [
        {
          "channel_label": "ch_0",
          "items": [
            {
              "start_time": "12.282",
              "end_time": "12.592",
              "alternatives": [
                {
                  "confidence": "1.0000",
                  "content": "When"
                }
              ],
              "type": "pronunciation"
            },
            {
              "start_time": "12.592",
              "end_time": "12.692",
              "alternatives": [
                {
                  "confidence": "0.8787",
                  "content": "you"
                }
              ],
              "type": "pronunciation"
            },
            {
              "start_time": "12.702",
              "end_time": "13.252",
              "alternatives": [
                {
                  "confidence": "0.8318",
                  "content": "try"
                }
              ],
              "type": "pronunciation"
            },
            ...
         ]
      },
      {
          "channel_label": "ch_1",
          "items": [
            {
              "start_time": "12.379",
              "end_time": "12.589",
              "alternatives": [
                {
                  "confidence": "0.5645",
                  "content": "It"
                }
              ],
              "type": "pronunciation"
            },
            {
              "start_time": "12.599",
              "end_time": "12.659",
              "alternatives": [
                {
                  "confidence": "0.2907",
                  "content": "seems"
                }
              ],
              "type": "pronunciation"
            },
            {
              "start_time": "12.669",
              "end_time": "13.029",
              "alternatives": [
                {
                  "confidence": "0.2497",
                  "content": "to"
                }
              ],
              "type": "pronunciation"
            },
            ...
        ]
    }
}
```

## Transcripción de secuencias de audio multicanal
<a name="conversation-channel-id-med-stream"></a>

Puede transcribir audio de distintos canales en HTTP/2 o en WebSocket transmisiones mediante la [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API.

De forma predeterminada, puede transcribir secuencias de audio con dos canales. Puede solicitar un aumento de cuota si necesita transcribir secuencias que tengan más de dos canales. Para obtener más información acerca de cómo solicitar un aumento de cuota, consulte [Service Quotas de AWS](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).

### Transcripción de audio multicanal en una secuencia HTTP/2
<a name="conversation-channel-id-http2"></a>

Para transcribir audio multicanal en una transmisión HTTP/2, usa la [StartMedicalStreamTranscription](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API y especifica lo siguiente:
+ `LanguageCode`: el código de idioma del audio. El valor válido es `en-US`.
+ `MediaEncoding`: la codificación del audio. Los valores válidos son `ogg-opus`, `flac` y `pcm`.
+ `EnableChannelIdentification` – `true`
+ `NumberOfChannels`: el número de canales en su streaming de audio.

Para obtener más información sobre cómo configurar una secuencia HTTP/2 para transcribir una conversación médica, consulte [Configuración de una secuencia HTTP/2](streaming-setting-up.md#streaming-http2).

### Transcribir audio multicanal en una transmisión WebSocket
<a name="channel-id-med-websocket"></a>

Para particionar los altavoces en las WebSocket transmisiones, utilice el siguiente formato para crear un URI prefirmado e iniciar una solicitud. WebSocket Especifique `enable-channel-identification` como `true` y el número de canales de la secuencia en `number-of-channels`. Un URI prefirmado contiene la información necesaria para configurar la comunicación bidireccional entre la aplicación y Medical. Amazon Transcribe 

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=languageCode
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&enable-channel-identification=true
&number-of-channels=2
```

Las definiciones de los parámetros se encuentran en la [referencia de la API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html); los parámetros comunes a todas las operaciones de la AWS API se enumeran en la sección [Parámetros comunes](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

Para obtener más información sobre WebSocket las solicitudes, consulte[Configurar una WebSocket transmisión](streaming-setting-up.md#streaming-websocket).

### Resultado del streaming multicanal
<a name="streaming-med-output"></a>

El resultado de una transcripción en streaming es el mismo para HTTP/2 y para WebSocket las solicitudes. El siguiente es un ejemplo de salida.

```
{
    "resultId": "XXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXX",
    "startTime": 0.11,
    "endTime": 0.66,
    "isPartial": false,
    "alternatives": [
        {
            "transcript": "Left.",
            "items": [
                {
                    "startTime": 0.11,
                    "endTime": 0.45,
                    "type": "pronunciation",
                    "content": "Left",
                    "vocabularyFilterMatch": false
                },
                {
                    "startTime": 0.45,
                    "endTime": 0.45,
                    "type": "punctuation",
                    "content": ".",
                    "vocabularyFilterMatch": false
                }
            ]
        }
    ],
    "channelId": "ch_0"
}
```

Para cada segmento de voz, hay una marca `channelId` que indica a qué canal pertenece la voz.