View a markdown version of this page

Lp-norma (LP) - SageMaker Inteligência Artificial da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Lp-norma (LP)

A norma Lp (LP) mede a distância da norma p entre as distribuições de facetas dos rótulos observados em um conjunto de dados de treinamento. Essa métrica não é negativa e, portanto, não pode detectar desvios reversos.

A fórmula para a norma Lp é a seguinte:

        L p (Pa, Pd) = (․ y ||P a - P d || p) 1/p

Onde a distância da norma p entre os pontos x e y é definida da seguinte forma:

        L p (x, y) = (|x 1 -y 1 | p + |x -y | p +... n +|x 2 -y 2 | p) n 1/p

A norma 2 é a norma euclidiana. Suponha que você tenha uma distribuição de resultados com três categorias, por exemplo, yi = {y0, y1, y2} = {aceito, na lista de espera, rejeitado} em um cenário multicategórico de admissões em faculdades. Você obtém a soma dos quadrados das diferenças entre as contagens de resultados para as facetas a e d. A distância euclidiana resultante é calculada da seguinte forma:

        L 2 (Pa, Pd) = [(n a (0) - n d (0)) 2 + (n a (1) - n d (1)) 2 + (n a (2) - n d (2)) 2] 1/2

Em que:

  • Númeroa(i) é o número dos resultados da i-ésima categoria na faceta a: por exemplo, na(0) é o número de aceitações da faceta a.

  • nd(i) é o número dos resultados da i-ésima categoria na faceta d: por exemplo, nd(2) é o número de rejeições da faceta d.

    O intervalo de valores de LP para resultados binários, multicategóricos e contínuos é [0, √2), onde:

    • Valores próximos de zero significam que os rótulos estão distribuídos de forma semelhante.

    • Valores positivos significam que as distribuições dos rótulos divergem; quanto mais positivas, maior a divergência.