

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Distância de variação total (TVD)
<a name="clarify-data-bias-metric-total-variation-distance"></a>

A métrica de polarização de dados da distância de variação total (TVD) é metade da norma L1. O TVD é a maior diferença possível entre as distribuições de probabilidade para resultados de rótulos das facetas *a* e *d*. A 1 norma L é a distância de Hamming, uma métrica usada para comparar duas strings de dados binários determinando o número mínimo de substituições necessárias para alterar uma sequência para outra. Se as strings fossem cópias umas das outras, isso determinaria a quantidade de erros que ocorreram durante a cópia. No contexto de detecção de desvio, o TVD quantifica quantos resultados na faceta *a* precisariam ser alterados para corresponder aos resultados na faceta *d*.

A fórmula para a distância de variação total é a seguinte: 

        TVD = ½\$1L1(Pa, Pd)

Por exemplo, suponha que você tenha uma distribuição de resultados com três categorias, yi = \$1y0, y1, y2\$1 = \$1aceito, na lista de espera, rejeitado\$1 em um cenário multicategórico de admissões em faculdades. Você usa as diferenças entre as contagens das facetas *a* e *d* para cada resultado para calcular o TVD. O resultado é o seguinte:

        L1(Pa, Pd) = \$1na(0) - nd(0)\$1 \$1 \$1na(1) - nd(1)\$1 \$1 \$1na(2) - nd(2)\$1

Em que: 
+ Númeroa(i) é o número dos resultados da i-ésima categoria na faceta *a*: por exemplo, na(0) é o número de aceitações da faceta *a*.
+ nd(i) é o número dos resultados da i-ésima categoria na faceta d: por exemplo, nd(2) é o número de rejeições da faceta *d*.

  O intervalo de valores de TVD para resultados binários, multicategóricos e contínuos é [0, 1), onde:
  + Valores próximos de zero significam que os rótulos estão distribuídos de forma semelhante.
  + Valores positivos significam que as distribuições dos rótulos divergem; quanto mais positivas, maior a divergência.