Dominio de contenido 3: Aplicaciones de los modelos fundacionales - Guía de examen de AWS Certified AI Practitioner

Dominio de contenido 3: Aplicaciones de los modelos fundacionales

El dominio 3 cubre las aplicaciones de los modelos fundacionales y representa el 28 % del contenido con puntaje del examen.

Enunciado de la tarea 3.1: Describir las consideraciones de diseño para las aplicaciones que utilizan modelos fundacionales (FM).

Objetivos:

  • Identificar los criterios de selección para elegir modelos previamente entrenados (por ejemplo, el costo, la modalidad, la latencia, el multilingüismo, el tamaño del modelo, la complejidad del modelo, la personalización, la longitud de entrada y salida, y el almacenamiento en caché de peticiones).

  • Describir el efecto de los parámetros de inferencia en las respuestas del modelo (por ejemplo, la temperatura y la longitud de entrada y salida).

  • Definir la generación aumentada por recuperación (RAG) y describir sus aplicaciones empresariales (por ejemplo, las bases de conocimientos de Amazon Bedrock).

  • Identificar los servicios de AWS que ayudan a almacenar las incorporaciones dentro de las bases de datos vectoriales (por ejemplo, Amazon OpenSearch Service, Amazon Aurora, Amazon Neptune, Amazon RDS para PostgreSQL).

  • Explicar las compensaciones de costos de los diversos enfoques para la personalización de modelos fundacionales (por ejemplo, el entrenamiento previo, el refinamiento, el aprendizaje en contexto y la RAG).

  • Describir el rol de los agentes en las tareas de varios pasos (por ejemplo, los Agentes para Amazon Bedrock, la IA agéntica y el protocolo de contexto para modelos).

Enunciado de la tarea 3.2: Elegir técnicas de ingeniería de peticiones eficaces.

Objetivos:

  • Definir los conceptos y las construcciones de la ingeniería de peticiones (por ejemplo, el contexto, la instrucción, las peticiones negativas, el espacio latente de modelos y el enrutamiento de peticiones).

  • Definir las técnicas de la ingeniería de peticiones (por ejemplo, cadena de pensamiento, sin ejemplos de entrenamiento, con un ejemplo de entrenamiento, con pocos ejemplos de entrenamiento y plantillas de peticiones).

  • Identificar y describir los beneficios y las prácticas recomendadas de la ingeniería de peticiones (por ejemplo, la mejora de la calidad de la respuesta, la experimentación, las barreras de protección, el descubrimiento, la especificidad y la concisión, mediante el uso de varios comentarios).

  • Definir los posibles riesgos y limitaciones de la ingeniería de peticiones (por ejemplo, la exposición, el envenenamiento, el secuestro y el jailbreak).

Enunciado de la tarea 3.3: Describir el proceso de entrenamiento y refinamiento de los modelos fundacionales.

Objetivos:

  • Describir los elementos clave del entrenamiento de un FM (por ejemplo, el entrenamiento previo, el refinamiento, el entrenamiento previo continuo y la destilación).

  • Definir los métodos para refinar un modelo fundacional (por ejemplo, el ajuste de las instrucciones, la adaptación de los modelos para dominios específicos, la transferencia del aprendizaje y el entrenamiento previo continuo).

  • Describir cómo preparar los datos para refinar un FM (por ejemplo, la selección de datos, la gobernanza, el tamaño, el etiquetado, la representatividad y el aprendizaje por refuerzo a partir de la retroalimentación humana [RLHF]).

Enunciado de la tarea 3.4: Describir los métodos para evaluar el rendimiento de los FM.

Objetivos:

  • Determinar enfoques para evaluar el rendimiento de FM (por ejemplo, la evaluación humana, los conjuntos de datos de referencia o la evaluación del modelo de Amazon Bedrock).

  • Identificar las métricas relevantes para evaluar el rendimiento de FM (por ejemplo, Recall-Oriented Understudy for Gisting Evaluation [ROUGE], métrica utilizada para la evaluación de resúmenes; Bilingual Evaluation Understudy [BLEU], métrica utilizada para la evaluación de traducciones automáticas y BERTScore).

  • Determinar si un FM cumple eficazmente los objetivos empresariales (por ejemplo, la productividad, la participación de los usuarios y la ingeniería de tareas).

  • Identificar los enfoques para evaluar el rendimiento de las aplicaciones que se crearon con FM (por ejemplo, la RAG, los agentes y los flujos de trabajo).