

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# バッチ予測データセットの要件
<a name="canvas-make-predictions-batch-preqreqs"></a>

バッチ予測を行うには、データセットが「[データセットの作成](canvas-import-dataset.md)」で説明されている要件を満たしていることを確認します。データセットが 5 GB を超える場合、Canvas では Amazon EMR Serverless を使用してデータを処理し、より小さなバッチに分割します。データの分割後、Canvas は SageMaker AI バッチ変換を使用して予測を行います。バッチ予測の実行後に、これらのサービスの両方から料金が発生する場合があります。詳細については、「[Canvas の料金](https://aws.amazon.com/sagemaker/canvas/pricing/)」を参照してください。

一部のデータセットが互換性のない*スキーマ*を持っている場合、予測を実行できないことがあります。*スキーマ*とは組織構造のことです。表形式のデータセットの場合は、列の名前と列内のデータのデータ型がスキーマになります。互換性のないスキーマは、次のような理由から発生することがあります。
+ 予測に使用するデータセットの列数が、モデルの構築に使用するデータセットよりも少ない。
+ データセットの構築に使用した列のデータ型が、予測に使用するデータセットのデータ型と異なる。
+ 予測に使用するデータセットとモデルの構築に使用したデータセットに、一致しない列名がある。列名では大文字と小文字が区別されます。`Column1` と `column1` は区別されます。

バッチ予測を正常に行うには、バッチ予測データセットのスキーマを、モデルのトレーニングに使用したデータセットと一致させます。

**注記**  
バッチ予測では、モデルの構築時にいずれかの列をドロップすると、Canvas は削除された列を予測結果に戻します。ただし、Canvas はドロップされた列を時系列モデルのバッチ予測に追加しません。