

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# SageMaker Studio でトレーニング前のデータのバイアスに関するレポートを生成する
<a name="clarify-data-bias-reports-ui"></a>

SageMaker Clarify は Amazon SageMaker Data Wrangler と統合されており、独自のコードを記述しなくても、データ準備中にバイアスを特定するのに役立ちます。Data Wrangler は、Amazon SageMaker Studio でデータをインポート、準備、変換、特徴化、分析するためのエンドツーエンドのソリューションを提供します。Data Wrangler のデータ準備ワークフローの概要については、「[Amazon SageMaker Data Wrangler で ML データを準備する](data-wrangler.md)」を参照してください。

性別や年齢などの関心のある属性を指定すると、SageMaker Clarify は一連のアルゴリズムを実行して、これらの属性にバイアスがあるかどうかを検出します。アルゴリズムの実行後、SageMaker Clarify は、バイアスの可能性のある発生源と重要度の説明を含むビジュアルレポートを提供するため、バイアスを軽減するステップを計画できます。例えば、ある年齢グループに対するビジネスローンの例が、他の年齢グループと比較して少ない財務データセットで、SageMaker AI は不均衡にフラグを立てて、その年齢グループに不利なモデルを回避できます。

**データバイアスを分析して報告する**

Data Wrangler の使用を開始するには、「[Data Wrangler の開始方法](data-wrangler-getting-started.md)」を参照してください。

1. Amazon SageMaker Studio Classic で、左側のパネルの **[ホーム]** (![\[Black square icon representing a placeholder or empty image.\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/studio/icons/house.png)) メニューから **[データ]** ノードに移動し、**[Data Wrangler]** を選択します。これにより、Studio Classic で **[Data Wrangler ランディングページ]** が開きます。

1. **[\$1 データのインポート]** ボタンを選択して新しいフローを作成します。

1. フローページの **[インポート]** タブから Amazon S3 を選択し、Amazon S3 バケットに移動してデータセットを見つけ、**[インポート]** を選択します。

1. データをインポートしたら、**[データフロー]** タブのフローグラフで、**[データ型]** ノードの右にある **[\$1]** 記号を選択します。

1. **[分析を追加]** を選択します。

1. **[分析を作成]** ページで、**[分析タイプ]** として **[バイアスレポート]** を選択します。

1. レポートの **[名前]** 、予測する列とそれが値なのかしきい値なのか、バイアス (ファセット) を分析する列およびそれが値なのかしきい値なのかを指定して、バイアスレポートを設定します。

1. バイアスメトリクスを選択して、バイアスレポートの設定を続行します。  
![\[バイアスメトリクスを選択します。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/clarify-data-wrangler-configure-bias-metrics.png)

1. **[Check for bias]** (バイアスを確認) を選択して、バイアスレポートを生成して表示します。下にスクロールしてすべてのレポートを表示します。  
![\[バイアスレポートを生成して表示します。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/clarify-data-wrangler-create-bias-report.png)

1. バイアスメトリクスそれぞれの説明の右側にあるキャレットを選択すると、メトリクス値の需要度を解釈するのに役立つドキュメントが表示されます。

1. バイアスメトリクス値のテーブル概要を表示するには、**[テーブル]** トグルを選択します。レポートを保存するには、ページの右下隅にある **[保存]** を選択します。レポートは **[データフロー]** タブのフローグラフで確認できます。レポートをダブルクリックして開きます。