# AWS Certified Machine Learning - Specialty (MLS-C01)
<a name="machine-learning-specialty-01"></a>

AWS Certified Machine Learning - Specialty (MLS-C01) 試験は、人工知能/機械学習 (AI/ML) の開発またはデータサイエンスの役割を担う方を対象としています。本試験では、AWS クラウドを使用して、特定のビジネス上の課題に対する機械学習ソリューションの設計、構築、デプロイ、最適化、トレーニング、チューニング、保守を行うための受験者の能力が検証されます。

**Topics**
+ [はじめに](#machine-learning-specialty-01-intro)
+ [受験対象者について](#machine-learning-specialty-01-target)
+ [試験内容](#machine-learning-specialty-01-exam-content)
+ [試験内容の概要](#machine-learning-specialty-01-domains)
+ [サービスリファレンス](#mls-service-references)
+ [コンテンツ分野 1: データエンジニアリング](machine-learning-specialty-01-domain1.md)
+ [コンテンツ分野 2: 探索的データ分析](machine-learning-specialty-01-domain2.md)
+ [コンテンツ分野 3: モデリング](machine-learning-specialty-01-domain3.md)
+ [コンテンツ分野 4: 機械学習の実装とその運用](machine-learning-specialty-01-domain4.md)
+ [対象の AWS サービス](mls-01-in-scope-services.md)
+ [対象外の AWS サービス](mls-01-out-of-scope-services.md)
+ [テクノロジーと概念](mls-technologies-concepts.md)
+ [アンケート](#machine-learning-specialty-01-survey)

## はじめに
<a name="machine-learning-specialty-01-intro"></a>

 [AWS Certified Machine Learning - Specialty (MLS-C01)](https://aws.amazon.com/certification/certified-machine-learning-specialty/) 試験は、人工知能/機械学習 (AI/ML) の開発またはデータサイエンスの役割を担う方を対象としています。本試験では、AWS クラウドを使用して、特定のビジネス上の課題に対する機械学習ソリューションの設計、構築、デプロイ、最適化、トレーニング、チューニング、保守を行うための受験者の能力が検証されます。

また、次のタスクについての受験者の能力も検証します。
+ 特定のビジネス上の課題に対して適切な ML アプローチを選択し、その正当性を説明する。
+ ML ソリューションの実装に適した AWS のサービスを特定する。
+ スケーラビリティ、コストの最適化、信頼性、セキュリティに優れた ML ソリューションを設計および実装する。

## 受験対象者について
<a name="machine-learning-specialty-01-target"></a>

受験対象者は、AWS クラウドでの ML ワークロードまたは深層学習ワークロードの開発、アーキテクチャの設計、実行における 2 年以上の実務経験が必要です。

### 推奨される AWS の知識
<a name="machine-learning-specialty-01-aws-knowledge"></a>

受験対象者は、次の AWS の知識を有している必要があります。
+ 基本的なハイパーパラメータ最適化の実行に関する経験
+ ML および深層学習のフレームワークに関する経験

### 受験対象者にとって試験対象外となるジョブタスク
<a name="machine-learning-specialty-01-out-of-scope"></a>

受験対象者が有していることが想定されていない知識は、次のリストのとおりです。このリストはすべてを網羅しているわけではありません。次の分野の知識は本試験の範囲外です。
+ 拡張アルゴリズムまたは複雑なアルゴリズムの開発
+ 拡張性の高いハイパーパラメータの最適化
+ 複雑な数学的証明と計算
+ 高度なネットワーキングとネットワーク設計
+ データベース、セキュリティ、DevOps の高度な概念
+ Amazon EMR の DevOps 関連タスク

## 試験内容
<a name="machine-learning-specialty-01-exam-content"></a>

試験には次の 2 種類の設問があります。
+ 択一選択問題: 正しい選択肢が 1 つ、誤った選択肢 (不正解) が 3 つ提示される。
+ 複数選択問題: 5 つ以上の選択肢のうち、正解が 2 つ以上ある。

設問の記述に最もよく当てはまるもの、または正解となるものを 1 つ以上選択します。不正解の選択肢は、知識や技術が不十分な受験者が選択してしまいそうな、設問内容と一致するもっともらしい解答になっています。

未解答の設問は不正解とみなされます。推測による解答にペナルティはありません。試験には、スコアに影響する設問が 50 問含まれています。

試験には、スコアに影響しない採点対象外の設問が 15 問含まれています。AWS では、これら採点対象外の設問における成績情報を収集し、これらの設問を今後採点対象の設問として使用できるかどうかを評価します。試験では、どの設問が採点対象外かは受験者にわからないようになっています。

AWS Certified Machine Learning - Specialty (MLS-C01) 試験は、合否判定方式です。試験の採点は、認定業界のベストプラクティスおよびガイドラインに基づいた、AWS の専門家によって定められる最低基準に照らして行われます。

試験の結果は、100～1,000 の換算スコアとして報告されます。合格スコアは 750 です。このスコアにより、試験全体の成績と合否がわかります。複数の試験間で難易度がわずかに異なる可能性があるため、スコアを均等化するために換算スコアが使用されます。

スコアレポートには、各セクションの成績を示す分類表が含まれる場合があります。試験には補整スコアリングモデルが使用されるため、セクションごとに合否ラインは設定されておらず、試験全体のスコアで合否が判定されます。

試験の各セクションには特定の重みが設定されているため、各セクションに割り当てられる設問数が異なる場合があります。分類表には、受験者の得意分野と不得意分野を示す全般的な情報が含まれます。セクションごとのフィードバックを解釈する際は注意してください。

## 試験内容の概要
<a name="machine-learning-specialty-01-domains"></a>

この試験ガイドには、試験に設定された重み、コンテンツ分野、タスクステートメントについての説明が含まれています。本ガイドは、試験内容の包括的なリストを提供するものではありません。ただし、各タスクステートメントの追加情報を使って、試験の準備に役立てることができます。

本試験のコンテンツ分野と重み設定は、次のとおりです。
+ [コンテンツ分野 1: データエンジニアリング (採点対象コンテンツの 20%)](machine-learning-specialty-01-domain1.md)
+ [コンテンツ分野 2: 探索的データ分析 (採点対象コンテンツの 24%)](machine-learning-specialty-01-domain2.md)
+ [コンテンツ分野 3: モデリング (採点対象コンテンツの 36%)](machine-learning-specialty-01-domain3.md)
+ [コンテンツ分野 4: 機械学習の実装と運用 (採点対象コンテンツの 20%)](machine-learning-specialty-01-domain4.md)

## サービスリファレンス
<a name="mls-service-references"></a>

次のセクションでは、本認定試験に関連する AWS のサービス、テクノロジー、概念について詳しく説明します。
+ [対象の AWS サービス](mls-01-in-scope-services.md)
+ [対象外の AWS サービス](mls-01-out-of-scope-services.md)
+ [テクノロジーと概念](mls-technologies-concepts.md)

# コンテンツ分野 1: データエンジニアリング
<a name="machine-learning-specialty-01-domain1"></a>

**Topics**
+ [タスク 1.1: ML 用のデータリポジトリを作成する。](#machine-learning-specialty-01-domain1-task1)
+ [タスク 1.2: データ取り込みソリューションを特定および実装する。](#machine-learning-specialty-01-domain1-task2)
+ [タスク 1.3: データ変換ソリューションを特定および実装する。](#machine-learning-specialty-01-domain1-task3)

## タスク 1.1: ML 用のデータリポジトリを作成する。
<a name="machine-learning-specialty-01-domain1-task1"></a>
+ データソース (コンテンツとロケーション、ユーザーデータなどのプライマリソースなど) を特定する。
+ ストレージメディア [データベース、Amazon S3、Amazon Elastic File System (Amazon EFS)、Amazon Elastic Block Store (Amazon EBS) など] を決定する。

## タスク 1.2: データ取り込みソリューションを特定および実装する。
<a name="machine-learning-specialty-01-domain1-task2"></a>
+ データジョブのスタイルとジョブの種類 (バッチロード、ストリーミングなど) を特定する。
+ データ取り込みのパイプライン (バッチベースの ML ワークロードとストリーミングベースの ML ワークロード) を調整する。
  + Amazon Kinesis
  + Amazon Data Firehose
  + Amazon EMR
  + AWS Glue
  + Amazon Managed Service for Apache Flink
+ ジョブをスケジュールする。

## タスク 1.3: データ変換ソリューションを特定および実装する。
<a name="machine-learning-specialty-01-domain1-task3"></a>
+ 転送中のデータを変換する (ETL、AWS Glue、Amazon EMR、AWS Batch)。
+ MapReduce を使用して ML 固有のデータ (Apache Hadoop、Apache Spark、Apache Hive など) を処理する。

# コンテンツ分野 2: 探索的データ分析
<a name="machine-learning-specialty-01-domain2"></a>

**Topics**
+ [タスク 2.1: モデリング用のデータをサニタイズおよび準備する。](#machine-learning-specialty-01-domain2-task1)
+ [タスク 2.2: 特徴量エンジニアリングを実行する。](#machine-learning-specialty-01-domain2-task2)
+ [タスク 2.3: ML のデータを分析および視覚化する。](#machine-learning-specialty-01-domain2-task3)

## タスク 2.1: モデリング用のデータをサニタイズおよび準備する。
<a name="machine-learning-specialty-01-domain2-task1"></a>
+ 欠損データ、破損データ、ストップワードを特定および処理する。
+ データをフォーマット、正規化、拡張、スケールする。
+ ラベル付けされたデータが十分にあるかどうかを判断する。
  + リスク軽減戦略を特定する。
  + データラベル付けツール (Amazon Mechanical Turk など) を使用する。

## タスク 2.2: 特徴量エンジニアリングを実行する。
<a name="machine-learning-specialty-01-domain2-task2"></a>
+ データセットから特徴量 (テキスト、音声、画像、パブリックデータセットなどのデータソースからの特徴量を含む) を特定および抽出する。
+ 特徴量エンジニアリングの概念 (ビニング、トークン化、外れ値、合成特徴量、ワンホットエンコーディング、データの次元低減など) を分析および評価する。

## タスク 2.3: ML のデータを分析および視覚化する。
<a name="machine-learning-specialty-01-domain2-task3"></a>
+ グラフ (散布図、時系列、ヒストグラム、箱ひげ図など) を作成する。
+ 記述統計 (相関、要約統計、p 値など) を解釈する。
+ クラスター分析 (階層分析、診断、エルボー図、クラスターサイズなど) を実行する。

# コンテンツ分野 3: モデリング
<a name="machine-learning-specialty-01-domain3"></a>

**Topics**
+ [タスク 3.1: ビジネス上の問題を ML の問題として捉える。](#machine-learning-specialty-01-domain3-task1)
+ [タスク 3.2: 特定の ML 問題に適したモデルを選択する。](#machine-learning-specialty-01-domain3-task2)
+ [タスク 3.3: ML モデルをトレーニングする。](#machine-learning-specialty-01-domain3-task3)
+ [タスク 3.4: ハイパーパラメータの最適化を実行する。](#machine-learning-specialty-01-domain3-task4)
+ [タスク 3.5: ML モデルを評価する。](#machine-learning-specialty-01-domain3-task5)

## タスク 3.1: ビジネス上の問題を ML の問題として捉える。
<a name="machine-learning-specialty-01-domain3-task1"></a>
+ ML を使用すべき場合と使用すべきでない場合を判断する。
+ 教師あり学習と教師なし学習の違いを知る。
+ 分類、回帰、予測、クラスタリング、レコメンデーション、基盤の中からモデルを選択する。

## タスク 3.2: 特定の ML 問題に適したモデルを選択する。
<a name="machine-learning-specialty-01-domain3-task2"></a>
+ XGBoost、ロジスティック回帰、K-means、線形回帰、決定木、ランダムフォレスト、RNN、CNN、アンサンブル、転移学習、大規模言語モデル (LLM)
+ モデルの背景にある直感を表現する。

## タスク 3.3: ML モデルをトレーニングする。
<a name="machine-learning-specialty-01-domain3-task3"></a>
+ データをトレーニング用と検証用 (交差検証など) に分割する。
+ ML トレーニングの最適化手法 (最急降下法、損失関数、収束など) を理解する。
+ 適切なコンピューティングリソース (GPU または CPU、分散型または非分散型など) を選択する。
  + 適切なコンピューティングプラットフォーム (Spark または Spark 以外) を選択する。
+ モデルを更新して再トレーニングする。
  + バッチまたはリアルタイム/オンライン

## タスク 3.4: ハイパーパラメータの最適化を実行する。
<a name="machine-learning-specialty-01-domain3-task4"></a>
+ 正則化を実行する。
  + ドロップアウト
  + L1/L2
+ 交差検証を実行する。
+ モデルを初期化する。
+ ニューラルネットワークのアーキテクチャ (レイヤーとノード)、学習率、活性化関数を理解する。
+ ツリーベースのモデル (ツリーの数、レベルの数) を理解する。
+ 線形モデル (学習率) を理解する。

## タスク 3.5: ML モデルを評価する。
<a name="machine-learning-specialty-01-domain3-task5"></a>
+ オーバーフィットやアンダーフィットを避ける。
  + バイアスとバリアンスを検出して処理する。
+ メトリクス [曲線下面積 (AUC) - 受信者動作特性 (ROC)、正解率、適合率、再現率、二乗平均平方根誤差 (RMSE)、F1 スコアなど] を評価する。
+ 混同行列を解釈する。
+ オフラインおよびオンラインでのモデル評価 (A/B テスト) を実行する。
+ メトリクス (モデルのトレーニング時間、モデルの品質、エンジニアリングコストなど) を使用してモデルを比較する。
+ 交差検証を実行する。

# コンテンツ分野 4: 機械学習の実装とその運用
<a name="machine-learning-specialty-01-domain4"></a>

**Topics**
+ [タスク 4.1: パフォーマンス、可用性、スケーラビリティ、レジリエンス、耐障害性を備えた ML ソリューションを構築する。](#machine-learning-specialty-01-domain4-task1)
+ [タスク 4.2: 特定の問題に対して適切な ML サービスと特徴を推奨し、実装する。](#machine-learning-specialty-01-domain4-task2)
+ [タスク 4.3: 基本的な AWS セキュリティプラクティスを ML ソリューションに適用する。](#machine-learning-specialty-01-domain4-task3)
+ [タスク 4.4: ML ソリューションをデプロイし、運用可能にする。](#machine-learning-specialty-01-domain4-task4)

## タスク 4.1: パフォーマンス、可用性、スケーラビリティ、レジリエンス、耐障害性を備えた ML ソリューションを構築する。
<a name="machine-learning-specialty-01-domain4-task1"></a>
+ AWS 環境をログに記録し、モニタリングする。
  + AWS CloudTrail と Amazon CloudWatch
  + エラーモニタリングソリューションを構築する。
+ 複数の AWS リージョンと複数のアベイラビリティーゾーンにデプロイする。
+ AMI とゴールデンイメージを作成する。
+ Docker コンテナを作成する。
+ Auto Scaling グループをデプロイする。
+ リソース (インスタンス、プロビジョンド IOPS、ボリュームなど) の適切なサイジングを行う。
+ ロードバランシングを実行する。
+ AWS のベストプラクティスに従う。

## タスク 4.2: 特定の問題に対して適切な ML サービスと特徴を推奨し、実装する。
<a name="machine-learning-specialty-01-domain4-task2"></a>
+ AWS での ML (アプリケーションサービス)。例:
  + Amazon Polly
  + Amazon Lex
  + Amazon Transcribe
  + Amazon Q
+ AWS サービスクォータを理解する。
+ カスタムモデルを構築すべき場合と、Amazon SageMaker 組み込みアルゴリズムを使用すべき場合を判断する。
+ AWS インフラストラクチャ (インスタンスタイプなど) とコストに関する考慮事項を理解する。
  + スポットインスタンスを使用し、AWS Batch を使用して、深層学習モデルをトレーニングする。

## タスク 4.3: 基本的な AWS セキュリティプラクティスを ML ソリューションに適用する。
<a name="machine-learning-specialty-01-domain4-task3"></a>
+ AWS Identity and Access Management (IAM)
+ S3 バケットポリシー
+ セキュリティグループ
+ VPC
+ 暗号化と匿名化

## タスク 4.4: ML ソリューションをデプロイし、運用可能にする。
<a name="machine-learning-specialty-01-domain4-task4"></a>
+ エンドポイントを公開して操作する。
+ ML モデルを理解する。
+ A/B テストを実行する。
+ パイプラインを再トレーニングする。
+ ML モデルのデバッグとトラブルシューティングを行う。
  + パフォーマンスの低下を検出および軽減する。
  + モデルのパフォーマンスをモニタリングする。

# 対象の AWS サービス
<a name="mls-01-in-scope-services"></a>

以下に、AWS Certified Machine Learning - Specialty (MLS-C01) 試験の対象となる AWS のサービスと機能のリストを示します。このリストはすべてを網羅しているわけではなく、また、変更される場合もあります。AWS のサービスは、サービスの主要機能に沿ったカテゴリに分類されています。

**Topics**
+ [分析](#mls-01-in-scope-analytics)
+ [コンピューティング](#mls-01-in-scope-compute)
+ [コンテナ](#mls-01-in-scope-containers)
+ [データベース](#mls-01-in-scope-database)
+ [IoT](#mls-01-in-scope-iot)
+ [機械学習](#mls-01-in-scope-machine-learning)
+ [マネジメントとガバナンス](#mls-01-in-scope-management-governance)
+ [ネットワークとコンテンツ配信](#mls-01-in-scope-networking)
+ [セキュリティ、アイデンティティ、コンプライアンス](#mls-01-in-scope-security)
+ [ストレージ](#mls-01-in-scope-storage)

## 分析
<a name="mls-01-in-scope-analytics"></a>
+ Amazon Athena
+ Amazon Data Firehose
+ Amazon EMR
+ AWS Glue
+ Amazon Kinesis
+ Amazon Kinesis Data Streams
+ AWS Lake Formation
+ Amazon Managed Service for Apache Flink
+ Amazon OpenSearch Service
+ Amazon QuickSight

## コンピューティング
<a name="mls-01-in-scope-compute"></a>
+ AWS Batch
+ Amazon EC2
+ AWS Lambda

## コンテナ
<a name="mls-01-in-scope-containers"></a>
+ Amazon Elastic Container Registry (Amazon ECR)
+ Amazon Elastic Container Service (Amazon ECS)
+ Amazon Elastic Kubernetes Service (Amazon EKS)
+ AWS Fargate

## データベース
<a name="mls-01-in-scope-database"></a>
+ Amazon Redshift

## IoT
<a name="mls-01-in-scope-iot"></a>
+ AWS IoT Greengrass

## 機械学習
<a name="mls-01-in-scope-machine-learning"></a>
+ Amazon Bedrock
+ Amazon Comprehend
+ AWS Deep Learning AMIs (DLAMI)
+ Amazon Forecast
+ Amazon Fraud Detector
+ Amazon Lex
+ Amazon Kendra
+ Amazon Mechanical Turk
+ Amazon Polly
+ Amazon Q
+ Amazon Rekognition
+ Amazon SageMaker
+ Amazon Textract
+ Amazon Transcribe
+ Amazon Translate

## マネジメントとガバナンス
<a name="mls-01-in-scope-management-governance"></a>
+ AWS CloudTrail
+ Amazon CloudWatch

## ネットワークとコンテンツ配信
<a name="mls-01-in-scope-networking"></a>
+ Amazon VPC

## セキュリティ、アイデンティティ、コンプライアンス
<a name="mls-01-in-scope-security"></a>
+ AWS Identity and Access Management (IAM)

## ストレージ
<a name="mls-01-in-scope-storage"></a>
+ Amazon Elastic Block Store (Amazon EBS)
+ Amazon Elastic File System (Amazon EFS)
+ Amazon FSx
+ Amazon S3

# 対象外の AWS サービス
<a name="mls-01-out-of-scope-services"></a>

以下に、AWS Certified Machine Learning - Specialty (MLS-C01) 試験の対象外となる AWS のサービスと機能のリストを示します。このリストはすべてを網羅しているわけではなく、また、変更される場合もあります。試験の対象となる職種内容にまったく関係のない AWS のサービスは、このリストから除外されています。

**Topics**
+ [分析](#mls-01-out-of-scope-analytics)
+ [機械学習](#mls-01-out-of-scope-machine-learning)

## 分析
<a name="mls-01-out-of-scope-analytics"></a>
+ AWS Data Pipeline

## 機械学習
<a name="mls-01-out-of-scope-machine-learning"></a>
+ AWS DeepRacer
+ Amazon Machine Learning (Amazon ML)

# テクノロジーと概念
<a name="mls-technologies-concepts"></a>

以下は、試験に出題される可能性のあるテクノロジーと概念のリストです。このリストはすべてを網羅しているわけではなく、また、変更される場合もあります。このリストにおける項目の掲載順序や配置は、その項目の相対的な重みや試験における重要性を示すものではありません。
+ 取り込みと収集
+ 処理と ETL
+ データ分析と可視化
+ モデルトレーニング
+ モデルのデプロイと推論
+ ML の運用化
+ AWS ML アプリケーションサービス
+ ML に関連する言語 (Python、Java、Scala、R、SQL など)
+ ノートブックおよび統合開発環境 (IDE)

## アンケート
<a name="machine-learning-specialty-01-survey"></a>

この試験ガイドはどの程度役に立ちましたか。ご意見をお待ちしています。[アンケートへの回答](https://amazonmr.au1.qualtrics.com/jfe/form/SV_8vLR1a9uG9zu9Po?course_title=MLS-Specialty&course_id=MLS-C01&Q_Language=EN)にご協力ください。