View a markdown version of this page

自動スケーリング設定 - AWS Deadline クラウド

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

自動スケーリング設定

Deadline Cloud には、フリートによるワーカーのスケールアップとスケールダウンの方法をカスタマイズできる自動スケーリング設定オプションが用意されています。これらの設定は、ワークフロー要件に基づいてジョブ処理速度とコスト効率のバランスを取るのに役立ちます。

フリートには、次の自動スケーリング設定を設定できます。

  • 最小ワーカー数 – フリートで常に維持されているワーカーの最小数を指定します。

  • 最大ワーカー数 – 同時に実行できるワーカーの数を制限します。

  • スケールアウトレート – ワーカーをフリートに追加する速度を制御します。

  • ワーカーのアイドル時間 – ワーカーがシャットダウンする前に新しい作業を待機する時間を制御します。

  • スタンバイワーカー数 – アイドル状態のワーカーのウォームスタンバイプールを維持し、ジョブをすばやく開始します。

自動スケーリングの仕組みは、フリートタイプによって異なります。

  • サービスマネージドフリート – Deadline Cloud は、設定に基づいて自動スケーリングを自動的に実装します。設定を構成すると、サービスはワーカーのプロビジョニングを処理します。

  • カスタマーマネージドフリート – カスタマーマネージドフリートの自動スケーリング設定を完了している場合、自動スケーリング設定はサービスマネージドフリートの場合と同じように機能します。サービスは 設定を使用して希望する容量を計算し、推奨されるフリートサイズのイベントをフリートに送信します。詳細については、「Deadline Cloud Developer Guide」の「Set up auto scaling for customer-managed fleets」を参照してください。

スケールアウトレート

スケールアウトレート (scaleOutWorkersPerMinute) 設定は、フリートがスケールアウトしたときに 1 分あたりに起動を開始するワーカーの数を制御します。Amazon EC2 インスタンスの起動には数分かかる場合があるため、ワーカーはすぐには利用できない場合があります。

スケールアウトレートを設定するときは、次の点を考慮してください。

  • レートが高いほど、より多くのワーカーをすばやく起動できるため、大規模なジョブのジョブ完了時間を短縮できます。

  • レートが高いと、存続期間の短いタスクに必要な数よりも多くのワーカーを起動し、コストが増加する可能性があります。

  • レートを低くすると、ジョブの失敗を早期に検出し、失敗したジョブの無駄なコンピューティングによるコストを削減できます。

  • 存続期間の短いタスクの場合、ワーカーが実際のタスク実行よりも環境のロードに費やす時間が短いため、保守的なスケーリングアプローチの方が費用対効果が高くなります。

注記

スケールアウトレートはベストエフォート設定です。実際のスケーリング速度は、インスタンスの可用性やその他のシステム要因によって異なる場合があります。まれに、実際のレートが設定値を一時的に超えることがあります。

ワーカーのアイドル時間

ワーカーアイドル時間 (workerIdleDurationSeconds) 設定は、ジョブの処理終了後にワーカーが使用可能な状態を維持する期間を秒単位で制御します。デフォルト値は 300 秒 (5 分) です。

この設定は、アーティストが頻繁にジョブを修正して再送信する反復ワークフローに役立ちます。ワーカーの可用性を長く維持することで、後続のジョブ送信は、新しいワーカーの起動を待たずにすぐに処理を開始できます。

ワーカーのアイドル時間を設定するときは、次の点を考慮してください。

  • 期間が長くなると、ワーカーは迅速に反復できるため、ジョブの送信間の待機時間が短縮されます。ただし、アイドル状態のワーカーには引き続き料金が発生するため、期間が長くなるとコストが増加します。

  • 期間が短いほど、アイドル状態のワーカーをより迅速にシャットダウンできるため、コストを削減できます。

  • サービスマネージドフリートの場合、ワーカーは 24 時間ごとに更新されるため、最大値は 86,400 秒 (24 時間) です。ワーカーが 23 時間実行されており、アイドル時間を 10 時間に設定した場合、ワーカーは 24 時間の制限に達すると 1 時間後にシャットダウンします。

スタンバイワーカー数

スタンバイワーカー数 (standbyWorkerCount) 設定は、ウォームスタンバイプールとして維持するアイドルワーカーの数を指定します。これらのワーカーは、新しいインスタンスの起動を遅らせることなく、新しいジョブを処理できます。

この設定は、ジョブ開始のレイテンシーを短縮する場合に便利です。たとえば、スタンバイワーカーは、Windows インスタンスでレンダリングする場合、ローカル依存関係をインストールするホスト設定スクリプトを使用する場合、またはワーカーがかなりのセットアップ時間を必要とする場合に役立ちます。フリートは設定された数のアイドルワーカーを維持しようとしますが、代替ワーカーの起動中にアイドル数が一時的に減少することがあります。

スタンバイワーカー数を設定するときは、次の点を考慮してください。

  • スタンバイワーカーは、ジョブを処理していない場合でもコストが発生します。スタンバイワーカーの数を予算とジョブ開始のレイテンシー要件と照らし合わせます。

  • フリートがワーカーの最大数に達すると、スタンバイプールが完全に維持されない可能性があります。たとえば、すべてのワーカーがビジー状態で、フリートが最大サイズである場合、追加のアイドルワーカーは起動されません。

  • スタンバイワーカー数が最小ワーカー数を超えると、最小ワーカー数は実質的に上書きされます。たとえば、最小 1、スタンバイ 2 の場合、フリートは作業が利用できないときに 2 人のアイドルワーカーを保持し、最小設定を冗長にします。

次の図は、最小ワーカー数とスタンバイワーカー数がフリートスケーリング動作にどのように影響するかを示しています。タブを選択すると、各シナリオが表示されます。

Minimum worker count
ワークロードに関係なく、最小ワーカー数がワーカーの固定合計を維持する方法を示す図。
Standby worker count
スタンバイワーカー数が一定数のアイドルワーカーを維持し、ジョブのピックアップ時に代替ワーカーを起動する方法を示す図。

スケジュールに基づいてスタンバイワーカーの数を自動的に調整するには、GitHub の fleet_standby_scheduling で sample AWS CloudFormation (CloudFormation) テンプレートを使用します。

自動スケーリング設定の構成

自動スケーリング設定は、フリートの作成時または既存のフリートの更新時に設定できます。

自動スケーリング設定を構成するには
  1. Deadline Cloud コンソールを開きます。

  2. フリートを含むファームに移動します。

  3. フリートタブを選択します。

  4. 設定するフリートを選択し、編集を選択します。

  5. Auto Scaling セクションで、次の設定を行います。

    • 最小ワーカー数 – 維持するワーカーの最小数を入力します。

    • 最大ワーカー数 – 許可されるワーカーの最大数を入力します。

    • スケールアウトレート – 1 分あたりに起動するワーカーの数を入力します。

    • ワーカーのアイドル時間 – シャットダウンするまでワーカーがアイドル状態のままになる秒数を入力します。

    • スタンバイワーカー数 – 維持するスタンバイワーカーの数を入力します。

  6. [Save changes] (変更の保存) をクリックします。