コンテンツ分野 4: 機械学習の実装とその運用
タスク
タスク 4.1: パフォーマンス、可用性、スケーラビリティ、レジリエンス、耐障害性を備えた ML ソリューションを構築する。
-
AWS 環境をログに記録し、モニタリングする。
AWS CloudTrail と Amazon CloudWatch
エラーモニタリングソリューションを構築する。
複数の AWS リージョンと複数のアベイラビリティーゾーンにデプロイする。
AMI とゴールデンイメージを作成する。
Docker コンテナを作成する。
Auto Scaling グループをデプロイする。
リソース (インスタンス、プロビジョンド IOPS、ボリュームなど) の適切なサイジングを行う。
ロードバランシングを実行する。
AWS のベストプラクティスに従う。
タスク 4.2: 特定の問題に対して適切な ML サービスと特徴を推奨し、実装する。
-
AWS での ML (アプリケーションサービス)。例:
Amazon Polly
Amazon Lex
Amazon Transcribe
Amazon Q
AWS サービスクォータを理解する。
カスタムモデルを構築すべき場合と、Amazon SageMaker 組み込みアルゴリズムを使用すべき場合を判断する。
-
AWS インフラストラクチャ (インスタンスタイプなど) とコストに関する考慮事項を理解する。
スポットインスタンスを使用し、AWS Batch を使用して、深層学習モデルをトレーニングする。
タスク 4.3: 基本的な AWS セキュリティプラクティスを ML ソリューションに適用する。
AWS Identity and Access Management (IAM)
S3 バケットポリシー
セキュリティグループ
VPC
暗号化と匿名化
タスク 4.4: ML ソリューションをデプロイし、運用可能にする。
エンドポイントを公開して操作する。
ML モデルを理解する。
A/B テストを実行する。
パイプラインを再トレーニングする。
-
ML モデルのデバッグとトラブルシューティングを行う。
パフォーマンスの低下を検出および軽減する。
モデルのパフォーマンスをモニタリングする。