

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 정확도 차이(AD)
<a name="clarify-post-training-bias-metric-ad"></a>

정확도 차이(AD) 지표는 여러 패싯에서의 예측의 정확도 간의 차이입니다. 이 지표는 한 패싯에서의 모델에 의한 분류가 다른 패싯에서보다 더 정확한지 여부를 결정합니다. AD는 한 패싯에서 제1종 오류와 제2종 오류가 더 많이 발생하는지 여부를 나타냅니다. 하지만 제1종 오류와 제2종 오류를 구분할 수는 없습니다. 예를 들어, 모델의 정확도는 서로 다른 연령대에서 동일하게 나타나는데, 한 연령대 집단에서는 대부분 거짓 긍정(제1종 오류)이고 다른 연령대 인구 집단에서는 대부분 거짓 부정(제2종 오류)인 오류가 발생할 수 있습니다.

또한, 만약 중년층 인구 집단(패싯 *a*)에 대한 대출 승인이 다른 연령대 인구 집단(패싯 *d*)에 비해 훨씬 높은 정확도로 이루어졌다면, 두 번째 집단의 적격 신청자 가운데 상당수가 대출이 거부되었거나(FN) 또는 해당 집단의 부적격 신청자 가운데 상당수가 대출을 승인받았거나(FP), 또는 둘 다에 해당됩니다. 이 때문에 두 연령대 집단에 대해 제공된 대출의 비율이 거의 동일한 경우에서도 두 번째 집단에 대한 집단 내 불공정이 야기될 수 있으며, 이러한 상황은 0에 가까운 DPPL 값으로 나타납니다.

AD 지표를 구하는 공식은 패싯 *a*에서의 예측 정확도(ACCa)에서 패싯 *d*에서의 예측 정확도(ACCd)를 빼는 것입니다.

        AD = ACCa - ACCd

위치:
+ ACCa = (TPa \+ TNa)/(TPa \+ TNa \+ FPa \+ FNa) 
  + TPa는 패싯 *a*에 대해 예측된 참 긍정입니다.
  + TNa은 패싯 *a*에 대해 예측된 참 부정입니다.
  + FPa는 패싯 *a*에 대해 예측된 거짓 긍정입니다.
  + FNa은 패싯 *a*에 대해 예측된 거짓 부정입니다.
+ ACCd = (TPd \+ TNd)/(TPd \+ TNd \+ FPd \+ FNd)
  + TPd는 패싯 *d*에 대해 예측된 참 긍정입니다.
  + TNd은 패싯 *d*에 대해 예측된 참 부정입니다.
  + FPd는 패싯 *d*에 대해 예측된 거짓 긍정입니다.
  + FNd은 패싯 *d*에 대해 예측된 거짓 부정입니다.

예를 들어, 어떤 모델이 신청자 100명의 패싯 *a*에서 70건의 대출 신청을 승인하고 나머지 30건은 거부했다고 가정해 보겠습니다.10건은 대출을 제공받지 않았어야 했고(FPa), 60건은 올바르게 승인되었습니다(TPa).거부 사례 중 20건은 승인되었어야 했고(FNa), 10건은 올바르게 거부되었습니다(TNa). 패싯 *a*에서의 정확도는 다음과 같습니다.

        ACCa = (60 \+ 10)/(60 \+ 10 \+ 20 \+ 10) = 0.7

다음으로, 어떤 모델이 신청자 100명의 패싯 *d*에서 50건의 대출 신청을 승인하고 나머지 50건은 거부했다고 가정해 보겠습니다.10건은 대출을 제공받지 않았어야 했고(FPa), 40건은 올바르게 승인되었습니다(TPa).거부 사례 중 40건은 승인되었어야 했고(FNa), 10건은 올바르게 거부되었습니다(TNa). 패싯 *a*에서의 정확도는 다음과 같이 결정됩니다.

        ACCd= (40 \+ 10)/(40 \+ 10 \+ 40 \+ 10) = 0.5

따라서 정확도 차이는 AD = ACCa - ACCd = 0.7 - 0.5 = 0.2가 됩니다. 이는 지표가 양수이므로 패싯 *d*에 대한 편향이 존재한다는 것을 나타냅니다.

바이너리 및 멀티카테고리 패싯 레이블에 대한 AD 값의 범위는 [-1, \+1]입니다.
+ 패싯 *a*에 대한 예측 정확도가 패싯 *d*에 대한 예측 정확도보다 높을 때 양수 값이 얻어집니다. 이는 패싯 *d*가 거짓 긍정(제1종 오류) 또는 거짓 부정(제2종 오류)의 일정한 조합으로 인해 비교적 많은 영향을 받고 있음을 나타냅니다. 이는 불리한 패싯 *d*에 대해 잠재적 편향이 발생하고 있음을 의미합니다.
+ 패싯 *a*에 대한 예측 정확도가 패싯 *d*에 대한 예측 정확도와 비슷할 때 0에 가까운 값이 얻어집니다.
+ 패싯 *d*에 대한 예측 정확도가 패싯 *a*에 대한 예측 정확도보다 높을 때 음수 값이 얻어집니다. 이는 패싯 *a*가 거짓 긍정(제1종 오류) 또는 거짓 부정(제2종 오류)의 일정한 조합으로 인해 비교적 많은 영향을 받고 있음을 나타냅니다. 이는 유리한 패싯 *a*에 대해 편향이 발생할 수 있음을 의미합니다.