

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Diferença de recordação (RD)
<a name="clarify-post-training-bias-metric-rd"></a>

A métrica de diferença de recordação (RD) é a diferença na recordação do modelo entre a faceta favorecida *a* e a faceta desfavorecida *d*. Qualquer diferença nessas recordações é uma forma potencial de desvio. A recordação é a taxa positivo verdadeira (TPR), que mede com que frequência o modelo prevê corretamente os casos que devem receber um resultado positivo. A recordação é perfeita para uma faceta se todos os casos y=1 forem corretamente previstos como y’=1 para essa faceta. A recordação é maior quando o modelo minimiza os falso-negativos, conhecidos como erro do Tipo II. Por exemplo, quantas pessoas em dois grupos diferentes (facetas *a* e *d*) que deveriam se qualificar para empréstimos são detectadas corretamente pelo modelo? Se a taxa de recordação for alta para empréstimos para a faceta *a*, mas baixa para empréstimos para a faceta *d*, a diferença fornece uma medida desse desvio em relação ao grupo pertencente à faceta *d*. 

A fórmula para a diferença nas taxas de recordação das facetas *a* e *d*:

        RD = TPa/(TPa \$1 FNa) - TPd/(TPd \$1 FNd) = TPRa - TPRd 

Em que:
+ TPa são os positivos verdadeiros previstos para a faceta *a*.
+ FNa são os falso-negativos previstos para a faceta *a*.
+ TPd são os positivos verdadeiros previstos para a faceta *d*.
+ FNd são os falso-negativos previstos para a faceta *d*.
+ TPR a = TPa/(TPa \$1 FNa) é a recordação da faceta *a*, ou sua taxa positiva verdadeira.
+ TPRd TPd/(TPd \$1 FNd) é a recordação da faceta *d*, ou sua taxa positiva verdadeira.

Por exemplo, considere as seguintes matrizes de confusão para as facetas *a* e *d*:

Matriz de confusão para a faceta a favorecida


| Previsões de classe a | Resultado real 0 | Resultado real 1 | Total  | 
| --- | --- | --- | --- | 
| 0 | 20 | 5 | 25 | 
| 1 | 10 | 65 | 75 | 
| Total | 30 | 70 | 100 | 

Matriz de confusão para a faceta d desfavorecida


| Previsões de classe d | Resultado real 0 | Resultado real 1 | Total  | 
| --- | --- | --- | --- | 
| 0 | 18 | 7 | 25 | 
| 1 | 5 | 20 | 25 | 
| Total | 23 | 27 | 50 | 

O valor da diferença de recordação é RD = 65/70 - 20/27 = 0,93 - 0,74 = 0,19, o que indica um desvio contra a faceta *d*.

O intervalo de valores para a diferença de recordação entre as facetas *a* e *d* para classificação binária e multicategórica é [-1, \$11]. Esta métrica não está disponível para o caso de rótulos contínuos.
+ Valores positivos são obtidos quando há maior recordação para a faceta *a* do que para a faceta *d*. Isso sugere que o modelo encontra mais positivos verdadeiros para a faceta *a* do que para a faceta *d*, que é uma forma de desvio. 
+ Valores próximos de zero indicam que a recordação das facetas sendo comparadas é semelhante. Isso sugere que o modelo encontra aproximadamente o mesmo número de positivos verdadeiros em ambas as facetas e não é tendencioso.
+ Valores negativos são obtidos quando há maior recordação para a faceta *d* do que para a faceta *a*. Isso sugere que o modelo encontra mais positivos verdadeiros para a faceta *d* do que para a faceta *a*, que é uma forma de desvio. 