

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Object2Vec ハイパーパラメータ
<a name="object2vec-hyperparameters"></a>

`CreateTrainingJob` リクエストで、トレーニングアルゴリズムを指定します。また、アルゴリズム固有のハイパーパラメータを文字列から文字列へのマップとして指定することもできます。次の表に、Object2Vec トレーニングアルゴリズムのハイパーパラメータを示します。


| Parameter Name | 説明 | 
| --- | --- | 
| enc0\_max\_seq\_len | enc0 エンコーダーの最大シーケンス長。<br />**必須**<br />有効な値: 1 ≤ 整数 ≤ 5000 | 
| enc0\_vocab\_size | enc0 トークンの語彙サイズ。<br />**必須**<br />有効な値: 2 ≤ 整数 ≤ 3000000 | 
| bucket\_width | バケット処理が有効になっている場合のデータシーケンス長の許容差。バケット処理を有効にするには、このパラメータにゼロ以外の値を指定します。<br />**オプション**<br />有効な値: 0 ≤ 整数 ≤ 100<br />デフォルト値: 0 (バケット処理なし) | 
| comparator\_list | 2 つの埋め込みを比較する方法のカスタマイズに使用されるリスト。Object2Vec 比較演算子レイヤーは、両方のエンコーダーからエンコードを入力として受け取り、単一のベクトルを出力します。このベクトルはサブベクトルの連結です。`comparator_list` に渡される文字列値と、それらが渡される順序によって、これらのサブベクトルの組み立て方法が決まります。たとえば、`comparator_list="hadamard, concat"` の場合、比較演算子は、2 つのエンコーディングのアダマール積と 2 つのエンコーディングの連結を連結してベクトルを作成します。一方、`comparator_list="hadamard"` の場合、比較演算子は 2 つのエンコーディングのみのアダマール積としてベクトルを構成します。<br />**オプション**<br />有効な値: 3 つの 2 項演算子の名前の任意の組み合わせを含む文字列: `hadamard`、`concat`、または `abs_diff`。現在 Object2Vec アルゴリズムでは、2 つのベクトルエンコーディングのディメンションが同じになるよう義務付けています。これらの演算子によって、次のようにサブベクトルが生成されます。[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/object2vec-hyperparameters.html)<br />デフォルト値: `"hadamard, concat, abs_diff"` | 
| dropout | ネットワークレイヤーのドロップアウト確率。*ドロップアウト*は、ニューラルネットワークで使用される正則化の一種であり、共依存ニューロンをトリミングすることで過剰適合を減らします。<br />**オプション**<br />有効な値: 0.0 ≤ 浮動小数点数 ≤ 1.0<br />デフォルト値: 0.0 | 
| early\_stopping\_patience | 早期停止前に許容される改善なしの連続エポック数が適用されます。改善は、`early_stopping_tolerance` ハイパーパラメータで定義されます。<br />**オプション**<br />有効な値: 1 ≤ 整数 ≤ 5<br />デフォルト値： 3 | 
| early\_stopping\_tolerance | `early_stopping_patience` ハイパーパラメータで指定される連続するエポックが複数回繰り返された後で早期停止が起きるのを回避するために、アルゴリズムが、連続するエポック間で達成しなければならない損失関数の減少。<br />**オプション**<br />有効な値: 0.000001 ≤ 浮動小数点数 ≤ 0.1<br />デフォルト値: 0.01 | 
| enc\_dim | 埋め込みレイヤーの出力の次元。<br />**オプション**<br />有効な値: 4 ≤ 整数 ≤ 10000<br />デフォルト値: 4096 | 
| enc0\_network | enc0 エンコーダーのネットワークモデル。<br />**オプション**<br />有効な値: `hcnn`、`bilstm`、または `pooled_embedding`[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/object2vec-hyperparameters.html)<br />デフォルト値: `hcnn` | 
| enc0\_cnn\_filter\_width | 畳み込みニューラルネットワーク (CNN) enc0 エンコーダーのフィルタ幅。<br />**条件付き**<br />有効な値: 1 ≤ 整数 ≤ 9<br />デフォルト値： 3 | 
| enc0\_freeze\_pretrained\_embedding | enc0 の事前トレーニング済み埋め込み重みを凍結するかどうか。<br />**条件付き**<br />有効な値: `True` または `False`<br />デフォルト値: `True` | 
| enc0\_layers  | enc0 エンコーダーのレイヤーの数。<br />**条件付き**<br />有効な値: `auto` または 1 ≤ 整数 ≤ 4[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/object2vec-hyperparameters.html)<br />デフォルト値: `auto` | 
| enc0\_pretrained\_embedding\_file | 補助データチャネル内の事前トレーニング済み enc0 トークン埋め込みファイルのファイル名。<br />**条件付き**<br />有効な値: 英数字、アンダースコア、またはピリオドを含む文字列。[A-Za-z0-9\\.\\\_] <br />デフォルト値: "" (空の文字列) | 
| enc0\_token\_embedding\_dim | enc0 トークン埋め込みレイヤーの出力次元。<br />**条件付き**<br />有効な値: 2 ≤ 整数 ≤ 1000<br />デフォルト値: 300 | 
| enc0\_vocab\_file | 事前トレーニング済みの enc0 トークン埋め込みベクトルを数値の語彙 ID にマッピングするための語彙ファイル。<br />**条件付き**<br />有効な値: 英数字、アンダースコア、またはピリオドを含む文字列。[A-Za-z0-9\\.\\\_] <br />デフォルト値: "" (空の文字列) | 
| enc1\_network | enc1 エンコーダーのネットワークモデル。enc1 エンコーダーで、enc0 と同じネットワークを使用する場合は (ハイパーパラメータ値を含む)、値を `enc0` に設定します。 enc0 および enc1 エンコーダーネットワークに同一の対称アーキテクチャがあっても、これらのネットワークの共有パラメータ値は共有されていません。 <br />**オプション**<br />有効な値: `enc0`、`hcnn`、`bilstm`、または `pooled_embedding`[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/object2vec-hyperparameters.html)<br />デフォルト値: `enc0` | 
| enc1\_cnn\_filter\_width | CNN enc1 エンコーダーのフィルタ幅。<br />**条件付き**<br />有効な値: 1 ≤ 整数 ≤ 9<br />デフォルト値： 3 | 
| enc1\_freeze\_pretrained\_embedding | enc1 の事前トレーニング済み埋め込み重みを凍結するかどうか。<br />**条件付き**<br />有効な値: `True` または `False`<br />デフォルト値: `True` | 
| enc1\_layers  | enc1 エンコーダーのレイヤーの数。<br />**条件付き**<br />有効な値: `auto` または 1 ≤ 整数 ≤ 4[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/object2vec-hyperparameters.html)<br />デフォルト値: `auto` | 
| enc1\_max\_seq\_len | enc1 エンコーダーの最大シーケンス長。<br />**条件付き**<br />有効な値: 1 ≤ 整数 ≤ 5000 | 
| enc1\_pretrained\_embedding\_file | 補助データチャネル内の事前トレーニング済み enc1 トークン埋め込みファイルのファイル名。<br />**条件付き**<br />有効な値: 英数字、アンダースコア、またはピリオドを含む文字列。[A-Za-z0-9\\.\\\_] <br />デフォルト値: "" (空の文字列) | 
| enc1\_token\_embedding\_dim | enc1 トークン埋め込みレイヤーの出力次元。<br />**条件付き**<br />有効な値: 2 ≤ 整数 ≤ 1000<br />デフォルト値: 300 | 
| enc1\_vocab\_file | 事前トレーニング済みの enc1 トークン埋め込みを語彙 ID にマッピングするための語彙ファイル。<br />**条件付き**<br />有効な値: 英数字、アンダースコア、またはピリオドを含む文字列。[A-Za-z0-9\\.\\\_] <br />デフォルト値: "" (空の文字列) | 
| enc1\_vocab\_size | enc0 トークンの語彙サイズ。<br />**条件付き**<br />有効な値: 2 ≤ 整数 ≤ 3000000 | 
| epochs | トレーニングのために実行するエポックの数 <br />**オプション**<br />有効な値: 1 ≤ 整数 ≤ 100<br />デフォルト値: 30 | 
| learning\_rate | トレーニングの学習レート。<br />**オプション**<br />有効な値: 1.0E-6 ≤ 浮動小数点数 ≤ 1.0<br />デフォルト値: 0.0004 | 
| mini\_batch\_size | トレーニング中に `optimizer` 用に分割されるデータセットのバッチサイズ。<br />**オプション**<br />有効な値: 1 ≤ 整数 ≤ 10000<br />デフォルト値: 32 | 
| mlp\_activation | 多層パーセプトロン (MLP) のレイヤーの活性化関数のタイプ。<br />**オプション**<br />有効な値: `tanh`、`relu`、または `linear`[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/object2vec-hyperparameters.html)<br />デフォルト値: `linear` | 
| mlp\_dim | MLP のレイヤーからの出力の寸法。<br />**オプション**<br />有効な値: 2 ≤ 整数 ≤ 10000<br />デフォルト値: 512 | 
| mlp\_layers | ネットワークの MLP レイヤーの数。<br />**オプション**<br />有効な値: 0 ≤ 整数 ≤ 10<br />デフォルト値: 2 | 
| negative\_sampling\_rate | アルゴリズムのトレーニングを支援するために生成された、負のサンプルと、ユーザーから提供された正のサンプルの比率。負のサンプルは、実際には発生する可能性が低いデータを表し、トレーニング用に負のラベルが付けられています。観察された正のサンプルとそれ以外の負のサンプルを区別するためにモデルをトレーニングしやすくなります。トレーニングに使用される正のサンプルに対する負のサンプルの比率を指定するには、値を正の整数に設定します。たとえば、すべてのサンプルが正である入力データでアルゴリズムをトレーニングし、`negative_sampling_rate` を 2 に設定した場合、Object2Vec アルゴリズムでは、正のサンプルごとに 2 つの負のサンプルが内部で生成されます。トレーニング中に負のサンプルを生成または使用しない場合は、値を 0 に設定します。<br />**オプション**<br />有効な値: 0 ≤ 整数<br />デフォルト値: 0 (オフ) | 
| num\_classes | 分類トレーニングのクラス数。Amazon SageMaker AI では、回帰問題のこのハイパーパラメータは無視されます。<br />**オプション**<br />有効な値: 2 ≤ 整数 ≤ 30<br />デフォルト値: 2 | 
| optimizer | オプティマイザのタイプ。<br />**オプション**<br />有効な値: `adadelta`、`adagrad`、`adam`、`sgd`、または `rmsprop`。[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/object2vec-hyperparameters.html)<br />デフォルト値: `adam` | 
| output\_layer | タスクが回帰または分類であると指定する出力レイヤーのタイプ。<br />**オプション**<br />有効な値: `softmax` または `mean_squared_error`[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/object2vec-hyperparameters.html)<br />デフォルト値: `softmax` | 
| tied\_token\_embedding\_weight | 両方のエンコーダーで共有埋め込みレイヤーを使用するかどうか。両方のエンコーダへの入力で同じトークンレベルのユニットを使用する場合は、共有トークン埋め込みレイヤーを使用します。たとえば、ドキュメントのコレクションで、1 つのエンコーダーでセンテンスをエンコードし、別のエンコーダーでドキュメント全体をエンコードする場合は、共有トークンの埋め込みレイヤーを使用できます。これは、ドキュメントとドキュメントのいずれも、同じ語彙からの単語トークンで構成されているためです。<br />**オプション**<br />有効な値: `True` または `False`<br />デフォルト値: `False` | 
| token\_embedding\_storage\_type | トレーニング中に使用されるグラデーション更新のモード: `dense` モードが使用されると、グラデーションのほとんどの行の値がゼロであっても、オプティマイザはトークン埋め込みレイヤーのフルグラデーションのマトリックスを計算します。`sparse` モードを使用すると、オプティマイザはミニバッチで実際に使用されているグラデーションの行のみを保存します。アルゴリズムで遅延グラデーション更新を実行して、ゼロ以外の行でのみグラデーションを計算し、トレーニングはスピードアップする場合は、`row_sparse` を指定します。次のように、値を `row_sparse` に設定すると、他のハイパーパラメータに使用できる値が制限されます。[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/object2vec-hyperparameters.html)<br />**オプション**<br />有効な値: `dense` または `row_sparse`<br />デフォルト値: `dense` | 
| weight\_decay | 最適化に使用される重み減衰パラメータ。<br />**オプション**<br />有効な値: 0 ≤ 浮動小数点数 ≤ 10000<br />デフォルト値: 0 (減衰なし) | 