

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Vocabularios personalizados
<a name="custom-vocabulary"></a>

Use vocabularios personalizados para mejorar la precisión de la transcripción de una o más palabras específicas. Por lo general, se trata de términos específicos de un dominio, como nombres de marcas y acrónimos, nombres propios y palabras que Amazon Transcribe no reproduce correctamente.

Los vocabularios personalizados se pueden usar con todos los idiomas admitidos. Tenga en cuenta que sólo los caracteres que figuran en el [conjunto de caracteres](charsets.md) de su idioma se pueden usar en un vocabulario personalizado.

**importante**  
Usted es responsable de la integridad de sus propios datos cuando utiliza Amazon Transcribe. No introduzca información confidencial, información personal (PII) ni información de salud protegida (PHI) en un vocabulario personalizado.

Consideraciones a la hora de crear un vocabulario personalizado:
+ Puede tener hasta 100 archivos de vocabulario personalizados por Cuenta de AWS
+ El límite de tamaño de un archivo de vocabulario personalizado es de 50 Kb
+ Si utiliza la API para crear su vocabulario personalizado, su archivo de vocabulario debe estar en formato de texto (\$1.txt). Si utiliza Consola de administración de AWS, su archivo de vocabulario puede estar en formato de texto (\$1.txt) o en formato de valores separados por comas (\$1.csv).
+ Cada entrada de un vocabulario personalizado no puede superar los 256 caracteres
+ Para usar un vocabulario personalizado, debe haberse creado en la misma Región de AWS que su transcripción.

**sugerencia**  
Puede poner a prueba su vocabulario personalizado utilizando Consola de administración de AWS. Cuando su vocabulario personalizado esté listo para usarse, inicie sesión enConsola de administración de AWS, seleccione **Transcripción en tiempo real**, desplácese hasta **Personalizaciones**, active **Vocabulario personalizado** y seleccione su vocabulario personalizado en la lista desplegable. Luego seleccione **iniciar streaming.** Diga algunas de las palabras de su vocabulario personalizado en el micrófono para comprobar si se reproducen correctamente.

## Tablas de vocabulario personalizadas en lugar de listas
<a name="custom-vocabulary-tables-lists"></a>

**importante**  
Los vocabularios personalizados en formato de lista están en desuso. Si va a crear un vocabulario personalizado nuevo, utilice el formato de [tabla](custom-vocabulary-create-table.md).

Las tablas ofrecen más opciones y más control sobre la entrada y salida de palabras de su vocabulario personalizado. En el caso de las tablas, debe especificar varias categorías (Phrase and DisplayAs), lo que le permitirá afinar el resultado.

Las listas no tienen opciones adicionales, por lo que sólo puede escribir las entradas tal como desee que aparezcan en la transcripción, sustituyendo todos los espacios por guiones.

Consola de administración de AWS, AWS CLI y los SDK de AWS utilizan tablas de vocabulario personalizadas de la misma manera; las listas se utilizan de forma diferente para cada método y, por lo tanto, pueden requerir un formato adicional para poder utilizarlas correctamente entre los métodos.

Para obtener más información, consulte [Creación de un vocabulario personalizado con una tabla](custom-vocabulary-create-table.md) y [Creación de un vocabulario personalizado en formato de lista](custom-vocabulary-create-list.md).

Para profundizar un poco más y aprender a usar Amazon Augmented AI con vocabularios personalizados, consulte:

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/65eVesNiJzY/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/65eVesNiJzY)


**Operaciones de API específicas para los vocabularios personalizados**  
 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DeleteVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DeleteVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ListVocabularies.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ListVocabularies.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_UpdateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_UpdateVocabulary.html) 

# Creación de un vocabulario personalizado con una tabla
<a name="custom-vocabulary-create-table"></a>

El uso de un formato de tabla es la forma preferida para crear un vocabulario personalizado. Las tablas de vocabulario deben constar de cuatro columnas (Phrase, SoundsLike, IPA, and DisplayAs), que se pueden incluir en cualquier orden:


| Phrase | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
|  Obligatorio. Cada fila de la tabla debe contener una entrada en esta columna. No utilice espacios en esta columna. Si la entrada contiene varias palabras, sepárelas con un guión (-). Por ejemplo, **Andorra-la-Vella** o **Los-Angeles**. En el caso de los acrónimos, cualquier letra pronunciada debe estar separada por un punto. También es necesario pronunciar el punto final. Si el acrónimo es plural, debe usar un guión entre el acrónimo y la “s”. Por ejemplo, “CLI” es **C.L.I.** (no **C.L.I**) y “ABCs” es **A.B.C.-s** (no **A.B.C-s**). Si la frase consta de una palabra y un acrónimo, estos dos componentes deben estar separados por un guión. Por ejemplo, “DynamoDB” es **Dynamo-D.B.**. No incluya dígitos en esta columna; los números deben estar escritos. Por ejemplo, “VX02QW” es **V.X.-zero-two-Q.**.  |  `SoundsLike` ya no es compatible con el vocabulario personalizado. Deje la columna vacía. Se ignorará cualquier valor de esta columna. Eliminaremos la compatibilidad con esta columna en el futuro.  |  `IPA` ya no es compatible con el vocabulario personalizado. Deje la columna vacía. Se ignorará cualquier valor de esta columna. Eliminaremos la compatibilidad con esta columna en el futuro.  |  Opcional. Las filas de esta columna se pueden dejar vacías. Puede utilizar espacios en esta columna. Ddefine el aspecto que desea que tenga la frase en el resultado de la transcripción. Por ejemplo, **Andorra-la-Vella** en la columna `Phrase` es **Andorra la Vella** en la columna `DisplayAs`. Si una fila de esta columna está vacía, Amazon Transcribe utiliza el contenido de la columna `Phrase` para determinar el resultado. Puede incluir dígitos (`0-9`) en esta columna.  | 

Aspectos a tener en cuenta al crear la tabla:
+ La tabla debe contener los encabezados (Phrase, SoundsLike, IPA, and DisplayAs) para las cuatro columnas. La columna `Phrase` debe contener una entrada en cada fila. La posibilidad de introducir entradas de pronunciación en `IPA` y `SoundsLike` ya no es compatible, por lo que puede dejar la columna vacía. Se ignorará cualquier valor de estas columnas.
+ Cada columna debe estar delimitada por tabuladores o comas (,); esto se aplica a todas las filas del archivo de vocabulario personalizado. Si una fila contiene columnas vacías, debe incluir un delineador (tabulador o coma) para cada columna.
+ Sólo se permiten espacios dentro de las columnas `IPA` y `DisplayAs`. No utilice espacios para separar las columnas.
+ `IPA` y `SoundsLike` ya no son compatibles con el vocabulario personalizado. Deje la columna vacía. Se ignorará cualquier valor de esta columna. Eliminaremos la compatibilidad con esta columna en el futuro.
+ La columna `DisplayAs` admite símbolos y caracteres especiales (por ejemplo, C\$1\$1). Todas las demás columnas admiten los caracteres que aparecen en la página del [conjunto de caracteres](charsets.md) de su idioma.
+ Si desea incluir números en la columna `Phrase`, debe deletrearlos. Los dígitos (`0-9`) sólo se admiten en la columna `DisplayAs`.
+ Debe guardar la tabla como un archivo de texto sin formato (\$1.txt) en formato `LF`. Si utiliza cualquier otro formato, por ejemplo `CRLF`, su vocabulario personalizado no se podrá procesar.
+ Debe cargar su archivo de vocabulario personalizado en un bucket de Amazon S3 y procesarlo mediante [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html) antes de poder incluirlo en una solicitud de transcripción. Para obtener instrucciones, consulte [Crear tablas de vocabulario personalizadas](#custom-vocabulary-create-table-examples).

**nota**  
Escriba los acrónimos, u otras palabras cuyas letras deban pronunciarse individualmente, como letras individuales separadas por puntos (**A.B.C.**). Para especificar el plural de un acrónimo en inglés, por ejemplo, "ABCs", separe la "s" del acrónimo con un guion: (**A.B.C.-s**). Puede utilizar letras mayúsculas o minúsculas para definir los acrónimos. Los acrónimos no se admiten en todos los idiomas; consulte [Idiomas compatibles y características específicas de cada idioma](supported-languages.md).

Este es un ejemplo de tabla de vocabulario personalizada (donde **[TAB]** representa un carácter de tabulación):

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
Los-Angeles[TAB][TAB][TAB]Los Angeles
Eva-Maria[TAB][TAB][TAB]
A.B.C.-s[TAB][TAB][TAB]ABCs
Amazon-dot-com[TAB][TAB][TAB]Amazon.com
C.L.I.[TAB][TAB][TAB]CLI
Andorra-la-Vella[TAB][TAB][TAB]Andorra la Vella
Dynamo-D.B.[TAB][TAB][TAB]DynamoDB
V.X.-zero-two[TAB][TAB][TAB]VX02
V.X.-zero-two-Q.[TAB][TAB][TAB]VX02Q
```

Para mayor claridad visual, esta es la misma tabla con las columnas alineadas. **No** agregue espacios entre las columnas de la tabla de vocabulario personalizada; la tabla debería tener un aspecto desalineado, como en el ejemplo anterior.

```
Phrase          [TAB]SoundsLike          [TAB]IPA                [TAB]DisplayAs  
Los-Angeles     [TAB]                    [TAB]                   [TAB]Los Angeles   
Eva-Maria       [TAB]                    [TAB]                   [TAB]
A.B.C.-s        [TAB]                    [TAB]                   [TAB]ABCs  
amazon-dot-com  [TAB]                    [TAB]                   [TAB]amazon.com
C.L.I.          [TAB]                    [TAB]                   [TAB]CLI   
Andorra-la-Vella[TAB]                    [TAB]                   [TAB]Andorra la Vella
Dynamo-D.B.     [TAB]                    [TAB]                   [TAB]DynamoDB
V.X.-zero-two   [TAB]                    [TAB]                   [TAB]VX02
V.X.-zero-two-Q.[TAB]                    [TAB]                   [TAB]VX02Q
```

## Crear tablas de vocabulario personalizadas
<a name="custom-vocabulary-create-table-examples"></a>

Para procesar una tabla de vocabulario personalizada y utilizarla con Amazon Transcribe, consulte los siguientes ejemplos:

### Consola de administración de AWS
<a name="vocab-create-table-console"></a>

1. Inicie sesión en [Consola de administración de AWS](https://console.aws.amazon.com/transcribe/).

1. En el panel de navegación, elija **Vocabulario personalizado**. Esto abre la página **Vocabulario personalizado**, donde puede ver los vocabularios existentes o crear uno nuevo.

1. Seleccione **Crear vocabulario**.  
![\[Captura de pantalla de la consola de Amazon Transcribe: página del “Vocabulario personalizado”.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/vocab-create-console.png)

   Esto le llevará a la página **Crear vocabulario**. Escriba un nombre para su nuevo vocabulario personalizado.

   Tiene tres opciones:

   1. Subir un archivo txt o csv desde su equipo.

      Puede crear su vocabulario personalizado desde cero o descargar una plantilla que le ayude a empezar. A continuación, el vocabulario se rellena automáticamente en el panel **Ver y editar vocabulario**.  
![\[Captura de pantalla de la consola de Amazon Transcribe: página “Crear e importar vocabulario”.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/vocab-create-console-upload.png)

   1. Importa un archivo txt o csv desde una ubicación de Amazon S3.

      Puede crear su vocabulario personalizado desde cero o descargar una plantilla que le ayude a empezar. Suba su archivo de vocabulario terminado a un bucket de Amazon S3 y especifique su URI en la solicitud. A continuación, el vocabulario se rellena automáticamente en el panel **Ver y editar vocabulario**.  
![\[Captura de pantalla de la consola de Amazon Transcribe: página “Crear e importar vocabulario”.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/vocab-create-console-s3.png)

   1. Crear su vocabulario manualmente en la consola.

      Desplácese hasta el panel **Ver y editar vocabulario** y seleccione **Añadir 10 filas**. Ahora puede introducir los términos manualmente.  
![\[Captura de pantalla de la consola de Amazon Transcribe: página “Crear e importar vocabulario”.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/vocab-create-console-manual.png)

1. Puede editar su vocabulario en el panel **Ver y editar vocabulario**. Haga clic en la entrada que desee modificar para realizar cambios.  
![\[Captura de pantalla de la consola de Amazon Transcribe: panel “Crear e importar vocabulario”.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/vocab-create-edit2.png)

   Si comete un error, recibirá un mensaje de error detallado para que pueda corregir cualquier problema antes de procesar su vocabulario. Tenga en cuenta que si no corrige todos los errores antes de seleccionar **Crear vocabulario**, su solicitud de vocabulario fallará.  
![\[Captura de pantalla de la consola de Amazon Transcribe: panel “Crear e importar vocabulario”.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/vocab-create-edit3.png)

   Seleccione la marca de verificación (✓) para guardar los cambios o la “X” para descartarlos.

1. De manera opcional, agregue etiquetas a su vocabulario personalizado. Cuando haya completado todos los campos y esté satisfecho con su vocabulario, seleccione **Crear vocabulario** en la parte inferior de la página. Esto le llevará de vuelta a la página **vocabulario personalizado**, donde podrá ver el estado de su vocabulario personalizado. Cuando el estado cambie de “Pendiente” a “Listo”, podrá usar su vocabulario personalizado con una transcripción.  
![\[Captura de pantalla de la consola de Amazon Transcribe: vocabulario personalizado en estado pendiente durante el procesamiento.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/vocab-create-console-pending.png)

1. Si el estado cambia a “Error”, seleccione el nombre de su vocabulario personalizado para ir a su página de información.  
![\[Captura de pantalla de la consola de Amazon Transcribe: página “Vocabulario personalizado” que muestra un vocabulario como completo y otro como fallido.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/vocab-create-console-failed.png)

   En la parte superior de esta página hay un banner **Motivo del error** que proporciona información sobre el motivo del error en su vocabulario personalizado. Corrija el error en el archivo de texto e inténtelo de nuevo.  
![\[Captura de pantalla de la consola de Amazon Transcribe: la página de información del vocabulario muestra el motivo del error.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/vocab-create-console-failed2.png)

### AWS CLI
<a name="vocab-create-table-cli"></a>

En este ejemplo, se utiliza el comando [create-vocabulary](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html) con un archivo de vocabulario con formato de tabla. Para obtener más información, consulte [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

Para usar un vocabulario personalizado existente en un trabajo de transcripción, establezca `VocabularyName` en el campo [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html) al llamar a la operación [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) o, en Consola de administración de AWS, elija el vocabulario personalizado de la lista desplegable.

```
aws transcribe create-vocabulary \ 
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US
```

Este es otro ejemplo en el que se usa el comando [create-vocabulary](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html) y un cuerpo de la solicitud que crea su vocabulario personalizado.

```
aws transcribe create-vocabulary \
--cli-input-json file://filepath/my-first-vocab-table.json
```

El archivo *my-first-vocab-table.json* contiene el siguiente cuerpo de la solicitud.

```
{
  "VocabularyName": "my-first-vocabulary",
  "VocabularyFileUri": "s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt",
  "LanguageCode": "en-US"
}
```

Cuando `VocabularyState` cambie de `PENDING` a `READY`, su vocabulario personalizado estará listo para usarse con una transcripción. Ejecute lo siguiente para consultar el estado actual de su vocabulario personalizado:

```
aws transcribe get-vocabulary \
--vocabulary-name my-first-vocabulary
```

### AWS SDK para Python (Boto3)
<a name="vocab-create-table-python-batch"></a>

En este ejemplo, se utiliza AWS SDK para Python (Boto3) para crear un vocabulario personalizado a partir de una tabla mediante el método [create\$1vocabulary](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary). Para obtener más información, consulte [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

Para usar un vocabulario personalizado existente en un trabajo de transcripción, establezca `VocabularyName` en el campo [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html) al llamar a la operación [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) o, en Consola de administración de AWS, elija el vocabulario personalizado de la lista desplegable.

Para ver ejemplos adicionales sobre el uso de los SDK de AWS, incluidos ejemplos de características específicas, escenarios y servicios cruzados, consulte el capítulo [Ejemplos de código para Amazon Transcribe usando AWS SDKs](service_code_examples.md).

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_vocabulary(
    LanguageCode = 'en-US',
    VocabularyName = vocab_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
)

while True:
    status = transcribe.get_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**nota**  
Si crea un nuevo bucket de Amazon S3 para sus archivos de vocabulario personalizados, asegúrese de que el rol IAM que realiza la solicitud [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html) tenga permisos para acceder a este bucket. Si el rol no tiene los permisos correctos, la solicitud fallará. Si lo desea, puede especificar un rol IAM en su solicitud incluyendo el parámetro `DataAccessRoleArn`. Para obtener más información sobre roles y políticas de IAM en Amazon Transcribe, consulte [Amazon Transcribe ejemplos de políticas basadas en la identidad](security_iam_id-based-policy-examples.md).

# Creación de un vocabulario personalizado en formato de lista
<a name="custom-vocabulary-create-list"></a>

**importante**  
Los vocabularios personalizados en formato de lista están en desuso, por lo que si va a crear un nuevo vocabulario personalizado, le recomendamos encarecidamente que utilice el [formato de tabla.](custom-vocabulary-create-table.md)

Puede crear vocabularios personalizados a partir de listas mediante Consola de administración de AWS, AWS CLI o los SDK de AWS.
+ **Consola de administración de AWS**: debe crear y cargar un archivo de texto que contenga su vocabulario personalizado. Puede utilizar entradas separadas por líneas o por comas. Tenga en cuenta que la lista debe guardarse como un archivo de texto (\$1.txt) en formato `LF`. Si utiliza otro formato, como el formato `CRLF`, Amazon Transcribe no aceptará su vocabulario personalizado.
+ **AWS CLI** y los **SDK de AWS**: debe incluir su vocabulario personalizado como entradas separadas por comas en su llamada a la API utilizando la marca [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html#transcribe-CreateVocabulary-request-Phrases](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html#transcribe-CreateVocabulary-request-Phrases).

Si una entrada contiene varias palabras, debe separar cada palabra con guiones. Por ejemplo, escriba “Los Ángeles” como **Los-Angeles** y “Andorra la Vella” como **Andorra-la-Vella**.

Estos son algunos ejemplos de los dos formatos de lista válidos. Consulte [Crear listas de vocabulario personalizadas](#custom-vocabulary-create-list-examples) para ver ejemplos específicos de cada método.
+ Entradas separadas por comas:

  ```
  Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  ```
+ Entradas separadas por líneas:

  ```
  Los-Angeles
  CLI
  Eva-Maria
  ABCs
  Andorra-la-Vella
  ```

**importante**  
Sólo puede usar caracteres compatibles con su idioma. Consulte el [conjunto de caracteres](charsets.md) de su idioma para obtener más información.

La operación [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html) no admite listas de vocabulario personalizadas. Si va a crear un vocabulario médico personalizado, debe utilizar un formato de tabla; consulte [Creación de un vocabulario personalizado con una tabla](custom-vocabulary-create-table.md) para obtener instrucciones.

## Crear listas de vocabulario personalizadas
<a name="custom-vocabulary-create-list-examples"></a>

Para procesar un filtro de vocabulario personalizado y usarlo con Amazon Transcribe, consulte los siguientes ejemplos:

### AWS CLI
<a name="vocab-create-list-cli"></a>

En este ejemplo, se utiliza el comando [create-vocabulary](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html) con un archivo de vocabulario personalizado con formato de lista. Para obtener más información, consulte [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

```
aws transcribe create-vocabulary \ 
--vocabulary-name my-first-vocabulary \ 
--language-code en-US \ 
--phrases {CLI,Eva-Maria,ABCs}
```

A continuación, se muestra otro ejemplo en el que se utiliza el comando [create-vocabulary](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html) y el cuerpo de la solicitud que crea el vocabulario personalizado.

```
aws transcribe create-vocabulary \
--cli-input-json file://filepath/my-first-vocab-list.json
```

El archivo *my-first-vocab-list.json* contiene el siguiente cuerpo de la solicitud.

```
{
  "VocabularyName": "my-first-vocabulary",
  "LanguageCode": "en-US",
  "Phrases": [
        "CLI","Eva-Maria","ABCs"
  ]
}
```

Cuando `VocabularyState` cambie de `PENDING` a `READY`, su vocabulario personalizado estará listo para usarse con una transcripción. Ejecute lo siguiente para consultar el estado actual de su vocabulario personalizado:

```
aws transcribe get-vocabulary \
--vocabulary-name my-first-vocabulary
```

### AWS SDK para Python (Boto3)
<a name="vocab-create-list-python-batch"></a>

En este ejemplo, se utiliza AWS SDK para Python (Boto3) para crear un vocabulario personalizado a partir de una lista mediante el método [create\$1vocabulary](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary). Para obtener más información, consulte [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

Para ver ejemplos adicionales sobre el uso de los SDK de AWS, incluidos ejemplos de características específicas, escenarios y servicios cruzados, consulte el capítulo [Ejemplos de código para Amazon Transcribe usando AWS SDKs](service_code_examples.md).

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_vocabulary(
    LanguageCode = 'en-US',
    VocabularyName = vocab_name,
    Phrases = [
        'CLI','Eva-Maria','ABCs'
    ]
)

while True:
    status = transcribe.get_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**nota**  
Si crea un nuevo bucket de Amazon S3 para sus archivos de vocabulario personalizados, asegúrese de que el rol IAM que realiza la solicitud [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html) tenga permisos para acceder a este bucket. Si el rol no tiene los permisos correctos, la solicitud fallará. Si lo desea, puede especificar un rol IAM en su solicitud incluyendo el parámetro `DataAccessRoleArn`. Para obtener más información sobre roles y políticas de IAM en Amazon Transcribe, consulte [Amazon Transcribe ejemplos de políticas basadas en la identidad](security_iam_id-based-policy-examples.md).

# Uso de un vocabulario personalizado
<a name="custom-vocabulary-using"></a>

Una vez creado su vocabulario personalizado, puede incluirlo en sus solicitudes de transcripción; consulte las siguientes secciones para ver ejemplos.

El idioma del vocabulario personalizado que incluya en la solicitud debe coincidir con el código de idioma que especifique para el contenido multimedia. Si los idiomas no coinciden, su vocabulario personalizado no se aplicará a la transcripción y no habrá advertencias ni errores.

## Usar un vocabulario personalizado en una transcripción por lotes
<a name="custom-vocabulary-using-batch"></a>

Para usar un vocabulario personalizado con una transcripción por lotes, consulte los siguientes ejemplos:

### Consola de administración de AWS
<a name="vocab-using-console-batch"></a>

1. Inicie sesión en [Consola de administración de AWS](https://console.aws.amazon.com/transcribe/).

1. En el panel de navegación, elija **Trabajos de transcripción** y, a continuación, seleccione **Crear trabajo** (arriba a la derecha). Se abrirá la página **Especificar los detalles del trabajo**.  
![\[Captura de pantalla de Amazon Transcribe: página “Especificar los detalles del trabajo”.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/console-batch-job-details-1.png)

   Asigne un nombre a su trabajo y especifique el medio de entrada. Si lo desea, incluya cualquier otro campo y, a continuación, seleccione **Siguiente**.

1. En la parte inferior de la página **Configurar trabajo**, en el panel **Personalización**, active **Vocabulario personalizado**.  
![\[Captura de pantalla de Amazon Transcribe: página “Configurar trabajo”.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/console-batch-configure-job-vocab.png)

1. Seleccione su vocabulario personalizado en el menú desplegable.

   Seleccione **Crear trabajo** para ejecutar el trabajo de transcripción. 

### AWS CLI
<a name="vocab-using-cli"></a>

En este ejemplo, se utilizan el comando [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html) y el parámetro `Settings` con el subparámetro `VocabularyName`. Para obtener más información, consulte [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) y [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html).

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings VocabularyName=my-first-vocabulary
```

A continuación, se muestra otro ejemplo en el que se utiliza el comando [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html) y el cuerpo de la solicitud que incluye su vocabulario personalizado para ese trabajo.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://my-first-vocabulary-job.json
```

El archivo *my-first-vocabulary-job.json* contiene el siguiente cuerpo de la solicitud.

```
{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "VocabularyName": "my-first-vocabulary"
   }
}
```

### AWS SDK para Python (Boto3)
<a name="vocab-using-python-batch"></a>

En este ejemplo, se utiliza AWS SDK para Python (Boto3) para incluir un vocabulario personalizado mediante el argumento `Settings` para el método [start\$1transcription\$1job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job). Para obtener más información, consulte [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) y [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html).

Para ver ejemplos adicionales sobre el uso de los SDK de AWS, incluidos ejemplos de características específicas, escenarios y servicios cruzados, consulte el capítulo [Ejemplos de código para Amazon Transcribe usando AWS SDKs](service_code_examples.md).

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'VocabularyName': 'my-first-vocabulary' 
   }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## Uso de un vocabulario personalizado en una transcripción en streaming
<a name="custom-vocabulary-using-stream"></a>

Para usar un vocabulario personalizado con una transcripción en streaming, consulte los siguientes ejemplos:

### Consola de administración de AWS
<a name="vocab-using-console-stream"></a>

1. Inicie sesión en el [Consola de administración de AWS](https://console.aws.amazon.com/transcribe/).

1. En el panel de navegación, elija **Transcripción en tiempo real**. Desplácese hacia abajo hasta **Personalizaciones** y expanda este campo si está minimizado.  
![\[Captura de pantalla de Amazon Transcribe: página “Transcripción en tiempo real”.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/stream-main.png)

1. Active **Vocabulario personalizado** y seleccione un vocabulario personalizado en el menú desplegable.  
![\[Captura de pantalla de Amazon Transcribe: panel ampliado “Personalizaciones”.\]](http://docs.aws.amazon.com/es_es/transcribe/latest/dg/images/vocab-stream2.png)

   Incluye cualquier otra configuración que desee aplicar a la transmisión.

1. Ahora tiene todo preparado para transcribir la secuencia. Seleccione **Comenzar streaming** y comience a hablar. Para finalizar el dictado, seleccione **Detener streaming**.

### Secuencia HTTP/2
<a name="vocab-using-http2"></a>

En este ejemplo, se crea una solicitud HTTP/2 que incluye su vocabulario personalizado. Para obtener más información sobre el uso del streaming HTTP/2 con Amazon Transcribe, consulte [Configuración de una secuencia HTTP/2](streaming-setting-up.md#streaming-http2). Para obtener más información sobre los parámetros y encabezados específicos de Amazon Transcribe, consulte. [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-transcribe-vocabulary-name: my-first-vocabulary
transfer-encoding: chunked
```

Las definiciones de los parámetros se encuentran en [Referencia de la API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html); los parámetros comunes a todas las operaciones de la API de AWS se enumeran en la sección [Parámetros comunes](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

### Secuencia de WebSocket
<a name="vocab-using-websocket"></a>

En este ejemplo, se crea una URL prefirmada que aplica su vocabulario personalizado a una secuencia de WebSocket. Se han añadido saltos de línea para facilitar la lectura. Para obtener más información acerca de cómo usar las secuencias de WebSocket con Amazon Transcribe, consulte [Configurar una WebSocket transmisión](streaming-setting-up.md#streaming-websocket). Para obtener más información sobre parámetros, consulte [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&media-encoding=flac
&sample-rate=16000    
&vocabulary-name=my-first-vocabulary
```

Las definiciones de los parámetros se encuentran en [Referencia de la API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html); los parámetros comunes a todas las operaciones de la API de AWS se enumeran en la sección [Parámetros comunes](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).