

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Lp-norm (LP)
<a name="clarify-data-bias-metric-lp-norm"></a>

Lp-范数 (LP) 衡量训练数据集中观测标签的分面分布之间的 p-范数距离。该指标为非负值，因此无法检测到反向偏差。

Lp-范数的公式如下：

        L p (Pa, Pd) = (y\|\|P a-P \| d \| p) 1/p

其中，点 x 和 y 之间的 p-范数距离定义如下：

        L p (x, y) = (\|x 1-y 1 \| p \+ \|x-y \| p \+... \+ n \|x 2-y 2 \| p) n 1/p 

2-范数是欧几里得范数。假设结果分布有三个类别，例如，在大学录取多类别场景中，yi = {y0, y1, y2} = {录取, 候补, 拒绝}。取分面 *a* 和 *d* 的结果计数之差的平方和。由此得出的欧几里得距离计算如下：

        L 2 (Pa, Pd) = [(n (0)-n a (0)) 2 \+ d (n (1)-n a (1)) 2 \+ d (n (2) -n (2)) 2 \+ a (n (2)-n d (2)) 2] 1/2

其中：
+ na(i) 是分面 *a* 中第 i 个类别结果的数量：例如 na(0) 是分面 *a* 的接受次数。
+ nd(i) 是分面 *d* 中第 i 个类别结果的数量：例如 nd(2) 是分面 *d* 的拒绝次数。

  二进制、多类别和连续结果的 LP 值范围为 [0, √2)，其中：
  + 接近零的值意味着标签的分布情况相似。
  + 正值表示标签分布存在差异，正值越大，差异就越大。