Dominio de contenido 3: Aplicaciones de los modelos fundacionales

El dominio 3 cubre las aplicaciones de los modelos fundacionales y representa el 28 % del contenido con puntaje del examen.

Enunciado de la tarea 3.1: Describir las consideraciones de diseño para las aplicaciones que utilizan modelos fundacionales (FM).

Objetivos:

Identificar los criterios de selección para elegir modelos fundacionales (por ejemplo, el costo, la modalidad, la latencia, el multilingüismo, el tamaño del modelo, la complejidad del modelo, la personalización, la longitud de entrada y salida, y el almacenamiento en caché de peticiones).
Describir el efecto de los parámetros de inferencia en las respuestas del modelo (por ejemplo, la temperatura y la longitud de entrada y salida).
Definir la generación aumentada por recuperación (RAG) y describir sus aplicaciones empresariales (por ejemplo, las bases de conocimientos de Amazon Bedrock).
Identificar los servicios de AWS que ayudan a almacenar las incorporaciones dentro de las bases de datos vectoriales (por ejemplo, Amazon OpenSearch Service, Amazon Aurora, Amazon Neptune, Amazon RDS para PostgreSQL).
Explicar las compensaciones de costos de los diversos enfoques para la personalización de modelos fundacionales (por ejemplo, el entrenamiento previo, el refinamiento, el aprendizaje en contexto, la RAG y la destilación de modelos).
Definir la función de los agentes de IA y describa las aplicaciones empresariales de los agentes de IA.

Objetivos:

Definir los conceptos y las construcciones de la ingeniería de peticiones (por ejemplo, el contexto, la instrucción y las peticiones negativas).
Definir las técnicas de la ingeniería de peticiones (por ejemplo, cadena de pensamiento, sin ejemplos de entrenamiento, con un ejemplo de entrenamiento, con pocos ejemplos de entrenamiento y plantillas de peticiones).
Identificar y describir los beneficios y las prácticas recomendadas de la ingeniería de peticiones (por ejemplo, la mejora de la calidad de la respuesta, la experimentación, las barreras de protección, el descubrimiento, la especificidad y la concisión, mediante el uso de varios comentarios).
Definir los posibles riesgos y limitaciones de la ingeniería de peticiones (por ejemplo, la exposición, el envenenamiento, el secuestro y el jailbreak).
Describir las estrategias rápidas de control de versiones y administración que utilizan Amazon Bedrock Prompt Management.

Objetivos:

Describir los elementos clave del entrenamiento de un FM (por ejemplo, el entrenamiento previo, el refinamiento, el entrenamiento previo continuo y la destilación).
Definir los métodos para refinar un modelo fundacional (por ejemplo, el ajuste de las instrucciones, la adaptación de los modelos para dominios específicos, la transferencia del aprendizaje y el entrenamiento previo continuo).
Describir cómo preparar los datos para refinar un FM (por ejemplo, la selección de datos, la gobernanza, el tamaño, el etiquetado, la representatividad y el aprendizaje por refuerzo a partir de la retroalimentación humana [RLHF]).

Objetivos:

Determinar enfoques para evaluar el rendimiento de FM (por ejemplo, la evaluación humana, los conjuntos de datos de referencia o la evaluación del modelo de Amazon Bedrock).
Identificar las métricas relevantes para evaluar el rendimiento de FM (por ejemplo, Recall-Oriented Understudy for Gisting Evaluation [ROUGE], métrica utilizada para la evaluación de resúmenes; Bilingual Evaluation Understudy [BLEU], métrica utilizada para la evaluación de traducciones automáticas, BERTScore y LLM como juez).
Determinar si un FM cumple eficazmente los objetivos empresariales (por ejemplo, la productividad, la participación de los usuarios y la ingeniería de tareas).
Identificar los enfoques para evaluar el rendimiento de las aplicaciones que se crearon con FM (por ejemplo, la RAG, los agentes y los flujos de trabajo).
Identificar las métricas de alineación de los objetivos empresariales para las aplicaciones de IA (por ejemplo, la tasa de finalización de las tareas, la satisfacción del usuario y el costo por interacción).

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Dominio de contenido 2: Aspectos básicos de la IA generativa

Dominio de contenido 4: Pautas para una IA responsable