翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
PySpark 分析テンプレートを使用して設定済みテーブルで PySpark ジョブを実行する
この手順では、コンソールで AWS Clean Rooms PySpark 分析テンプレートを使用して、カスタム分析ルールで設定済みテーブルを分析する方法を示します。
PySpark 分析テンプレートを使用して設定済みテーブルで PySpark ジョブを実行するには
にサインイン AWS マネジメントコンソール し、https://console.aws.amazon.com/cleanrooms
-
左のナビゲーションペインで、[コラボレーション] を選択します。
-
メンバーの能力ステータスが Run jobs のコラボレーションを選択します。
-
分析タブのテーブルセクションで、テーブルと関連する分析ルールタイプ (カスタム分析ルール) を表示します。
-
分析セクションの分析モード で、分析テンプレートの実行 を選択します。
-
分析テンプレートドロップダウンリストから PySpark 分析テンプレートを選択します。
PySpark 分析テンプレートのパラメータは、 定義に自動的に入力されます。
-
分析テンプレートにパラメータが定義されている場合は、Parameters でパラメータの値を指定します。
-
パラメータごとに、パラメータ名とデフォルト値 (設定されている場合) を表示します。
-
上書きする各パラメータの値を入力します。
注記
値を指定せず、デフォルト値が存在する場合は、デフォルト値が使用されます。
重要
パラメータ値は最大 1,000 文字で、UTF-8 エンコーディングをサポートします。すべてのパラメータ値は文字列として扱われ、コンテキストオブジェクトを介してユーザースクリプトに渡されます。
ユーザースクリプトがパラメータ値を安全に検証して処理していることを確認します。安全なパラメータ処理の詳細については、「」を参照してくださいPySpark 分析テンプレートでのパラメータの操作。
-
-
サポートされているワーカータイプとワーカー数を指定します。
次の表を使用して、ユースケースに必要なタイプと数、またはワーカーを決定します。
ワーカータイプ vCPU メモリ (GB) ストレージ (GB) ワーカー数 クリーンルーム処理ユニット (CRPU) の合計 CR.1X (デフォルト) 4 30 100 4 8 128 256 CR.4X 16 120 400 4 32 32 256 注記
さまざまなワーカータイプとワーカー数には関連コストがあります。料金の詳細については、「 AWS Clean Rooms の料金
」を参照してください。 -
[Run] (実行) を選択します。
注記
結果を受け取ることができるメンバーがジョブ結果の設定を行っていない場合、ジョブを実行することはできません。
-
パラメータを調整してジョブを再度実行するか、+ ボタンを選択して新しいタブで新しいジョブを開始します。