

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Domanda e risposta per la valutazione del modello in Amazon Bedrock
<a name="model-evaluation-tasks-question-answer"></a>

Domanda e risposta vengono utilizzate per attività quali la generazione di risposte automatiche dall’help desk, il recupero di informazioni e l’e-learning. Se il testo utilizzato per addestrare il modello di fondazione contiene problemi quali dati incompleti o imprecisi, sarcasmo o ironia, la qualità delle risposte può peggiorare.

**Importante**  
Per domanda e risposta esiste un problema di sistema noto che impedisce ai modelli Cohere di completare con successo una valutazione della tossicità.

I seguenti set di dati integrati sono consigliati per l'uso con il tipo di attività di domanda e risposta.

**BoolQ**  
BoolQ è un set di dati composto da coppie di yes/no domande e risposte. Il prompt contiene un breve brano e quindi una domanda sul brano. Questo set di dati è consigliato per l’uso con tipi di attività di domanda e risposta.

**Natural questions**  
Natural questions è un set di dati composto da domande reali degli utenti inviate alla ricerca Google.

**TriviaQA**  
TriviaQA è un set di dati che contiene oltre 650.000 question-answer-evidence-triples. Questo set di dati viene utilizzato nelle attività di domanda e risposta.

La tabella seguente riepiloga le metriche calcolate e il set di dati integrato consigliato. *Per specificare correttamente i set di dati integrati disponibili utilizzando o un AWS SDK supportato AWS CLI, utilizzate i nomi dei parametri nella colonna Datasets (API). Built-in*


**Set di dati integrati disponibili per il tipo di attività di domanda e risposta in Amazon Bedrock**  


- **Domanda e risposta**
  - **Metrica:** Accuratezza / **Built-in set di dati (console):** [BoolQ](https://github.com/google-research-datasets/boolean-questions) / **Built-in set di dati (API):** Builtin.BoolQ / **Metrica calcolata:** NLP-F1
  - **Built-in set di dati (console):** [NaturalQuestions](https://github.com/google-research-datasets/natural-questions) / **Built-in set di dati (API):** Builtin.NaturalQuestions
  - **Built-in set di dati (console):** [TriviaQA](https://nlp.cs.washington.edu/triviaqa/) / **Built-in set di dati (API):** Builtin.TriviaQa
  - **Metrica:** Robustezza / **Built-in set di dati (console):** [BoolQ](https://github.com/google-research-datasets/boolean-questions) / **Built-in set di dati (API):** Builtin.BoolQ / **Metrica calcolata:** F1 e deltaF1
  - **Built-in set di dati (console):** [NaturalQuestions](https://github.com/google-research-datasets/natural-questions) / **Built-in set di dati (API):** Builtin.NaturalQuestions
  - **Built-in set di dati (console):** [TriviaQA](https://nlp.cs.washington.edu/triviaqa/) / **Built-in set di dati (API):** Builtin.TriviaQa
  - **Metrica:** Tossicità / **Built-in set di dati (console):** [BoolQ](https://github.com/google-research-datasets/boolean-questions) / **Built-in set di dati (API):** Builtin.BoolQ / **Metrica calcolata:** Tossicità
  - **Built-in set di dati (console):** [NaturalQuestions](https://github.com/google-research-datasets/natural-questions) / **Built-in set di dati (API):** Builtin.NaturalQuestions
  - **Built-in set di dati (console):** [TriviaQA](https://nlp.cs.washington.edu/triviaqa/) / **Built-in set di dati (API):** Builtin.TriviaQa



Per ulteriori informazioni su come viene calcolata la metrica per ogni set di dati integrato, consultare [Analisi dei report e delle metriche relativi ai processi di valutazione del modello in Amazon Bedrock](model-evaluation-report.md)