# Domínio do conteúdo 3: Aplicações de modelos de base
<a name="ai-practitioner-01-domain3"></a>

O domínio 3 abrange aplicações de modelos de base e representa 28% do conteúdo pontuado no exame.

**Topics**
+ [Declaração de tarefa 3.1: Descrever as considerações sobre design de aplicações que usam modelos de base (FMs).](#ai-practitioner-01-task3.1)
+ [Declaração de tarefa 3.2: Escolher técnicas eficazes de engenharia de prompts.](#ai-practitioner-01-task3.2)
+ [Declaração de tarefa 3.3: Descrever o processo de treinamento e ajuste fino dos FMs.](#ai-practitioner-01-task3.3)
+ [Declaração de tarefa 3.4: Descrever os métodos para avaliar o desempenho do FM.](#ai-practitioner-01-task3.4)

## Declaração de tarefa 3.1: Descrever as considerações sobre design de aplicações que usam modelos de base (FMs).
<a name="ai-practitioner-01-task3.1"></a>

Objetivos:
+ Identificar os critérios de seleção para escolher modelos de base (FM) pré-treinados (por exemplo, custo, modalidade, latência, multilíngue, tamanho do modelo, complexidade do modelo, personalização, tamanho da entrada/saída e armazenamento em cache de prompts).
+ Descrever o efeito dos parâmetros de inferência nas respostas do modelo (por exemplo, temperatura e tamanho da entrada/saída).
+ Definir a geração aumentada via recuperação (RAG) e descrever suas aplicações empresariais (por exemplo, bases de conhecimento do Amazon Bedrock).
+ Identificar os serviços da AWS que ajudam a armazenar incorporações em bancos de dados de vetores (por exemplo, Amazon OpenSearch Service, Amazon Aurora, Amazon Neptune e Amazon RDS para PostgreSQL).
+ Explicar as compensações de custos de várias abordagens para a personalização de modelos de base (FM) (por exemplo, pré-treinamento, ajuste fino, aprendizado em contexto, RAG e destilação de modelos).
+ Definir a função dos agentes de IA e descrever aplicações de comerciais de agentes de IA.

## Declaração de tarefa 3.2: Escolher técnicas eficazes de engenharia de prompts.
<a name="ai-practitioner-01-task3.2"></a>

Objetivos:
+ Descrever os conceitos e os componentes da engenharia de prompts (por exemplo, contexto, instrução e prompts negativos).
+ Definir as técnicas de engenharia de prompts (por exemplo, modelos de cadeia de pensamento, zero shot, single shot, few shot e de prompt).
+ Identificar e descrever os benefícios e as práticas recomendadas da engenharia de prompts (por exemplo, melhoria da qualidade da resposta, experimentação, barreiras de proteção, descoberta, especificidade e concisão e uso de vários comentários).
+ Definir os possíveis riscos e limitações da engenharia de prompts (por exemplo, exposição, envenenamento, sequestro e jailbreaking).
+ Descrever estratégias de versionamento de prompts e de gerenciamento que usam o Amazon Bedrock Prompt Management.

## Declaração de tarefa 3.3: Descrever o processo de treinamento e ajuste fino dos FMs.
<a name="ai-practitioner-01-task3.3"></a>

Objetivos:
+ Descrever os principais elementos do treinamento de um FM (por exemplo, pré-treinamento, ajuste fino, pré-treinamento contínuo e destilação).
+ Definir os métodos de ajuste fino de um FM (por exemplo, ajuste de instruções, adaptação de modelos para domínios específicos, aprendizado por transferência e pré-treinamento contínuo).
+ Descrever como preparar dados para o ajuste fino de um FM [por exemplo, curadoria de dados, governança, tamanho, rotulagem, representatividade e aprendizado por reforço com feedback humano (RLHF)].

## Declaração de tarefa 3.4: Descrever os métodos para avaliar o desempenho do FM.
<a name="ai-practitioner-01-task3.4"></a>

Objetivos:
+ Determinar abordagens para avaliar o desempenho de modelos de base (FM) (por exemplo, avaliação humana, conjuntos de dados de referência e Avaliação de Modelo do Amazon Bedrock).
+ Identificar métricas relevantes para avaliar o desempenho de modelos de base (FM) [por exemplo, ROUGE (Recall-Oriented Understudy for Gisting Evaluation), BLEU (Bilingual Evaluation Understudy), BERTScore e LLM como avaliador].
+ Determinar se um modelo de base (FM) atende efetivamente aos objetivos empresariais (por exemplo, produtividade, envolvimento dos usuários e engenharia de tarefas).
+ Identificar abordagens para avaliar o desempenho de aplicações criadas com modelos de base (FM) (por exemplo, RAG, agentes, fluxos de trabalho).
+ Identificar métricas de alinhamento de objetivos de negócios para aplicações de IA (por exemplo, taxa de conclusão de tarefas, satisfação do usuário, custo por interação).