L_p-norma (LP)

A norma L_p (LP) mede a distância da norma p entre as distribuições de facetas dos rótulos observados em um conjunto de dados de treinamento. Essa métrica não é negativa e, portanto, não pode detectar desvios reversos.

A fórmula para a norma L_p é a seguinte:

^{L _p (P_a, P_d) = (․ _y ||P _a - P _d || p) ^1/p}

Onde a distância da norma p entre os pontos x e y é definida da seguinte forma:

^{L _p (x, y) = (|x ₁ -y ₁ | ^{p + |x -y | p} +... _n +|x ₂ -y ₂ | ^p) _n ^1/p}

A norma 2 é a norma euclidiana. Suponha que você tenha uma distribuição de resultados com três categorias, por exemplo, y_i = {y₀, y₁, y₂} = {aceito, na lista de espera, rejeitado} em um cenário multicategórico de admissões em faculdades. Você obtém a soma dos quadrados das diferenças entre as contagens de resultados para as facetas a e d. A distância euclidiana resultante é calculada da seguinte forma:

L ₂ (P_a, P_d) = [(n _a ⁽⁰⁾ - n _d ⁽⁰⁾) ² + (n _a ⁽¹⁾ - n _d ⁽¹⁾) ² + (n _a ⁽²⁾ - n _d ⁽²⁾) ²] ^1/2

Em que:

Número_a⁽ⁱ⁾ é o número dos resultados da i-ésima categoria na faceta a: por exemplo, n_a⁽⁰⁾ é o número de aceitações da faceta a.
n_d⁽ⁱ⁾ é o número dos resultados da i-ésima categoria na faceta d: por exemplo, n_d⁽²⁾ é o número de rejeições da faceta d.

O intervalo de valores de LP para resultados binários, multicategóricos e contínuos é [0, √2), onde:
- Valores próximos de zero significam que os rótulos estão distribuídos de forma semelhante.
- Valores positivos significam que as distribuições dos rótulos divergem; quanto mais positivas, maior a divergência.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Jensen-Shannon Divergência (JS)

Distância de variação total (TVD)

Lp-norma (LP)

L_p-norma (LP)