

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Lp-norm (LP)
<a name="clarify-data-bias-metric-lp-norm"></a>

Lp- ノルム (LP) は、トレーニングデータセットの観測ラベルのファセット分布間の p- ノルム距離を測定します。このメトリクスは負ではないため、逆バイアスを検出できません。

Lp- ノルムの計算式は次のとおりです。

        Lp(Pa, Pd) = ( ∑y\|\|Pa - Pd\|\|p)1/p

ここで、点 x と点 y の間の p- ノルム距離は次のように定義されます。

        Lp(x, y) = (\|x1-y1\|p \+ \|x2-y2\|p \+ … \+\|xn-yn\|p)1/p 

2- ノルムはユークリッドノルムです。例えば、大学入試のマルチカテゴリシナリオで、3 つのカテゴリ (yi = {y0, y1, y2} = {合格, 補欠, 不合格}) の結果分布があるとします。ファセット a と d の結果カウントの差の 2 乗の和を求めます。****結果のユークリッド距離は次のように計算されます。

        L2(Pa, Pd) = [(na(0) - nd(0))2 \+ (na(1) - nd(1))2 \+ (na(2) - nd(2))2]1/2

説明は以下のとおりです。
+ na(i) は、ファセット a の i 番目のカテゴリの結果の数です。例えば、na(0) は、ファセット a の承認の数です。****
+ nd(i) は、ファセット d の i 番目のカテゴリの結果の数です。例えば、nd(2) は、ファセット d の拒否の数です。****

  バイナリ、マルチカテゴリ、連続結果の LP 値の範囲は、[0, √2) です。
  + ゼロに近い値は、ラベルが同様に分布していることを意味します。
  + 正の値は、ラベル分布の発散を意味し、正の値が大きいほど発散が大きくなります。