

# JSON データを含む文字列の列の解析


この変換は、JSON データを含む文字列の列を解析し、JSON がオブジェクトか配列かに応じて、それぞれを構造体または配列の列に変換します。(オプション) 解析された列と元の列の両方を保持できます。

JSON スキーマは、オプションのサンプリングを使用して提供または推測できます (JSON オブジェクトの場合)。

**JSON 列解析変換ノードをジョブ図に追加するには**

1. リソースパネルを開いて、**[Parse JSON Column]** を選択し、ジョブ図に新しい変換を追加します。ノードを追加する際に選択したノードが、その親になります。

1. ノードのプロパティパネルで、ジョブ図にノード名を入力します。ノードの親がまだ選択されていない場合、[**Node parents**] (ノードの親) リストから、変換の入力ソースとして使用するノードを選択します。

1. **[変換]** タブで、JSON 文字列を含む列を選択します。

1. (オプション) **[変換]** タブで、JSON データが従うスキーマを、SQL 構文を使用して入力します (例: オブジェクトの場合は「field1 STRING, field2 INT」、配列の場合は「ARRAY<STRING>」)。

   配列の場合はスキーマが必要ですが、オブジェクトの場合はデータを使用して推測されます (スキーマが指定されていない場合)。スキーマの推論による影響を軽減するため (特に大規模なデータセットの場合)、**[Ratio of samples to use to infer schema]** を入力することで、データ全体を 2 回読み取る必要がなくなります。値が 1 より小さい場合は、対応するランダムサンプルの比率を使用してスキーマが推測されます。データに信頼性があり、行間でオブジェクトが一貫している場合は、0.1 などの小さな比率を使用してパフォーマンスを高めることができます。

1. (オプション) 元の文字列の列と解析された列の両方を保持する場合は、**[変換]** タブで新しい列名を入力します。