View a markdown version of this page

PySpark 分析テンプレートを使用して設定済みテーブルで PySpark ジョブを実行する - AWS Clean Rooms

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

PySpark 分析テンプレートを使用して設定済みテーブルで PySpark ジョブを実行する

この手順では、コンソールで AWS Clean Rooms PySpark 分析テンプレートを使用して、カスタム分析ルールで設定済みテーブルを分析する方法を示します。

PySpark 分析テンプレートを使用して設定済みテーブルで PySpark ジョブを実行するには

にサインイン AWS マネジメントコンソール し、https://console.aws.amazon.com/cleanrooms で AWS Clean Rooms コンソールを開きます。

  1. 左のナビゲーションペインで、[コラボレーション] を選択します。

  2. メンバーの能力ステータスが Run jobs のコラボレーションを選択します。

  3. 分析タブのテーブルセクションで、テーブルと関連する分析ルールタイプ (カスタム分析ルール) を表示します。

    注記

    想定したテーブルが表示されない場合は、次のいずれかの理由が考えられます。

  4. 分析セクションの分析モード で、分析テンプレートの実行 を選択します。

  5. 分析テンプレートドロップダウンリストから PySpark 分析テンプレートを選択します。

    PySpark 分析テンプレートのパラメータは、 定義に自動的に入力されます。

  6. 分析テンプレートにパラメータが定義されている場合は、Parameters でパラメータの値を指定します。

    1. パラメータごとに、パラメータ名デフォルト値 (設定されている場合) を表示します。

    2. 上書きする各パラメータの値を入力します。

      注記

      値を指定せず、デフォルト値が存在する場合は、デフォルト値が使用されます。

    重要

    パラメータ値は最大 1,000 文字で、UTF-8 エンコーディングをサポートします。すべてのパラメータ値は文字列として扱われ、コンテキストオブジェクトを介してユーザースクリプトに渡されます。

    ユーザースクリプトがパラメータ値を安全に検証して処理していることを確認します。安全なパラメータ処理の詳細については、「」を参照してくださいPySpark 分析テンプレートでのパラメータの操作

  7. サポートされているワーカータイプワーカー数を指定します。

    次の表を使用して、ユースケースに必要なタイプと数、またはワーカーを決定します。

    ワーカータイプ vCPU メモリ (GB) ストレージ (GB) ワーカー数 クリーンルーム処理ユニット (CRPU) の合計
    CR.1X (デフォルト) 4 30 100 4 8
    128 256
    CR.4X 16 120 400 4 32
    32 256
    注記

    さまざまなワーカータイプとワーカー数には関連コストがあります。料金の詳細については、「 AWS Clean Rooms の料金」を参照してください。

  8. [Run] (実行) を選択します。

    注記

    結果を受け取ることができるメンバーがジョブ結果の設定を行っていない場合、ジョブを実行することはできません。

  9. パラメータを調整してジョブを再度実行するか、+ ボタンを選択して新しいタブで新しいジョブを開始します。