As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Lp-norma (LP)
A norma Lp (LP) mede a distância da norma p entre as distribuições de facetas dos rótulos observados em um conjunto de dados de treinamento. Essa métrica não é negativa e, portanto, não pode detectar desvios reversos.
A fórmula para a norma Lp é a seguinte:
L p (Pa, Pd) = (․ y ||P a - P d || p) 1/p
Onde a distância da norma p entre os pontos x e y é definida da seguinte forma:
L p (x, y) = (|x 1 -y 1 | p + |x -y | p +... n +|x 2 -y 2 | p) n 1/p
A norma 2 é a norma euclidiana. Suponha que você tenha uma distribuição de resultados com três categorias, por exemplo, yi = {y0, y1, y2} = {aceito, na lista de espera, rejeitado} em um cenário multicategórico de admissões em faculdades. Você obtém a soma dos quadrados das diferenças entre as contagens de resultados para as facetas a e d. A distância euclidiana resultante é calculada da seguinte forma:
L 2 (Pa, Pd) = [(n a (0) - n d (0)) 2 + (n a (1) - n d (1)) 2 + (n a (2) - n d (2)) 2] 1/2
Em que:
-
Númeroa(i) é o número dos resultados da i-ésima categoria na faceta a: por exemplo, na(0) é o número de aceitações da faceta a.
-
nd(i) é o número dos resultados da i-ésima categoria na faceta d: por exemplo, nd(2) é o número de rejeições da faceta d.
O intervalo de valores de LP para resultados binários, multicategóricos e contínuos é [0, √2), onde:
-
Valores próximos de zero significam que os rótulos estão distribuídos de forma semelhante.
-
Valores positivos significam que as distribuições dos rótulos divergem; quanto mais positivas, maior a divergência.
-