

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon Translate の並列データ入力ファイル
<a name="customizing-translations-parallel-data-input-files"></a>

Amazon Translate で並列データリソースを作成する前に、翻訳例を含む入力ファイルを作成する必要があります。並列データ入力ファイルでは、Amazon Translate でサポートされている言語を使用する必要があります。これらの言語のリストについては、「[サポートされている言語と言語コード](what-is-languages.md)」を参照してください。

## 並列データの例
<a name="customizing-translations-parallel-data-input-files-example-pd"></a>

次の表に示すテキストは、並列データ入力ファイルにフォーマットできる翻訳セグメントの例を示しています。


| en | es | zh | 
| --- | --- | --- | 
|  Amazon Translate is a neural machine translation service。  |  Amazon Translate es un servicio de traducción automática basado en redes neuronales。  |  Amazon Translate 是一项神经机器翻译服务。  | 
|  Neural machine translation is a form of language translation automation that uses deep learning models。  |  La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo。  |  神经机器翻译使用深度学习模型，是一种语言翻译自动化的形式。  | 
|  Amazon Translate allows you to localize content for international users。  |  Amazon Translate le permite localizar contenido para usuarios internacionales。  |  Amazon Translate 允许您为国际用户本地化内容。  | 

表の最初の行に表示されているのは言語コードです。1 つ目の言語である英語 (en) がソース言語です。スペイン語 (es) と中国語 (zh) がターゲット言語です。1列目にはソーステキストの例が示されています。その他の列には翻訳の例が記載されています。この並列データでバッチジョブをカスタマイズすると、Amazon Translate ではその例が反映されて翻訳が適応されます。

## 入力ファイル形式
<a name="customizing-translations-parallel-data-input-files-formats"></a>

Amazon Translate では、並列データ入力ファイルに対して次の形式がサポートされています。
+ Translation Memory eXchange (TMX)
+ カンマ区切り値 (CSV)
+ タブ区切り値 (TSV)

------
#### [ TMX ]



**Example TMX 入力ファイル**  
次のサンプル TMX ファイルでは、Amazon Translate で使用できる形式で並列データが定義されています。このファイルでは、英語 (`en`) がソース言語です。スペイン語 (`es`) と中国語 (`zh`) がターゲット言語です。バッチジョブの出力を調整するために Amazon Translate で並列データの入力ファイルとして使用できるいくつかの例が提示されています。  

```
<?xml version="1.0" encoding="UTF-8"?>
<tmx version="1.4">
    <header srclang="en"/>
    <body>
        <tu>
            <tuv xml:lang="en">
                <seg>Amazon Translate is a neural machine translation service.</seg>
            </tuv>
            <tuv xml:lang="es">
                <seg>Amazon Translate es un servicio de traducción automática basado en redes neuronales.</seg>
            </tuv>
            <tuv xml:lang="zh">
                <seg>Amazon Translate 是一项神经机器翻译服务。</seg>
            </tuv>
        </tu>
        <tu>
            <tuv xml:lang="en">
                <seg>Neural machine translation is a form of language translation automation that uses deep learning models.</seg>
            </tuv>
            <tuv xml:lang="es">
                <seg>La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.</seg>
            </tuv>
            <tuv xml:lang="zh">
                <seg>神经机器翻译使用深度学习模型，是一种语言翻译自动化的形式。</seg>
            </tuv>
        </tu>
        <tu>
            <tuv xml:lang="en">
                <seg>Amazon Translate allows you to localize content for international users.</seg>
            </tuv>
            <tuv xml:lang="es">
                <seg>Amazon Translate le permite localizar contenido para usuarios internacionales.</seg>
            </tuv>
            <tuv xml:lang="zh">
                <seg>Amazon Translate 允许您为国际用户本地化内容。</seg>
            </tuv>
        </tu>
    </body>
</tmx>
```

**TMX の要件**

TMX ファイルで並列データを定義する場合は、Amazon Translate の次の要件に注意してください。
+ Amazon Translate では TMX 1.4b がサポートされています。詳細については、Globalization and Localization Association ウェブサイトの [TMX 1.4b の仕様](https://www.gala-global.org/tmx-14b#SectionReferences) を参照してください。
+ `header` 要素には必ず `srclang` 属性を含めてください。この属性の値によって並列データのソース言語が決まります。
+ `body` 要素には必ず、少なくとも 1 つの翻訳単位 (`tu`) 要素を含めてください。
+ 各 `tu` 要素には必ず、少なくとも 2 つの翻訳単位バリアント (`tuv`) 要素が含めてください。これらの `tuv` 要素のうちの 1 つに、必ず、`header` 要素の `srclang` 属性に割り当てられている値と値が同じである `xml:lang` 属性を含めてください。
+ すべての `tuv` 要素に必ず `xml:lang` 属性を含めてください。
+ すべての `tuv` 要素に必ずセグメント (`seg`) 要素を含めてください。
+ 入力ファイルの処理中、空である、またはホワイトスペースしかない `seg` 要素が発生した場合は、Amazon Translate では特定の `tu` 要素または `tuv` 要素がスキップされます。
  + `seg` 要素がソース言語に対応している場合は、Amazon Translate では `seg` 要素が占めている `tu` 要素がスキップされます。
  + `seg` 要素がターゲット言語に対応している場合は、Amazon Translate では `seg` 要素が占めている `tuv` 要素のみがスキップされます。
+ 入力ファイルの処理中、空である、または 1000 バイトを超えている `seg` 要素が発生した場合は、Amazon Translate では特定の `tu` 要素または `tuv` 要素がスキップされます。
  + `seg` 要素がソース言語に対応している場合は、Amazon Translate では `seg` 要素が占めている `tu` 要素がスキップされます。
  + `seg` 要素がターゲット言語に対応している場合は、Amazon Translate では `seg` 要素が占めている `tuv` 要素のみがスキップされます。
+ ソーステキストが同一である複数の `tu` 要素が入力ファイルに含まれている場合、Amazon Translate では次のいずれかの処理が実行されます。
  + `tu` 要素に `changedate` 属性が含まれている場合は、直近の日付の要素が使用されます。
  + それ以外の場合は、そのファイルの最後に最も近い時期に生じる要素が使用されます。

------
#### [ CSV ]

次のサンプル CSV ファイルでは、Amazon Translate で使用できる形式で並列データが定義されています。このファイルでは、英語 (`en`) がソース言語です。スペイン語 (`es`) と中国語 (`zh`) がターゲット言語です。バッチジョブの出力を調整するために Amazon Translate で並列データの入力ファイルとして使用できるいくつかの例が提示されています。

**Example CSV 入力ファイル**  

```
en,es,zh
Amazon Translate is a neural machine translation service.,Amazon Translate es un servicio de traducción automática basado en redes neuronales.,Amazon Translate 是一项神经机器翻译服务。
Neural machine translation is a form of language translation automation that uses deep learning models.,La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.,神经机器翻译使用深度学习模型，是一种语言翻译自动化的形式。
Amazon Translate allows you to localize content for international users.,Amazon Translate le permite localizar contenido para usuarios internacionales.,Amazon Translate 允许您为国际用户本地化内容。
```

**CSV 要件**

CSV ファイルで並列データを定義する場合は、Amazon Translate の次の要件に注意してください。
+ 1 行目は言語コードで構成されます。最初のコードはソース言語で、後続の各コードはターゲット言語です。
+ 1 列目の各フィールドにはソーステキストが記載されています。後続の列の各フィールドにはターゲット翻訳が記載されています。
+ いずれかのフィールドのテキストにカンマが含まれている場合、そのテキストを二重引用符 (") で囲む必要があります。
+ テキストフィールドを複数の行に渡って表示することはできません。
+ フィールドの最初の文字として \$1、-、=、@ は使用できません。この要件は、フィールドが二重引用符 (") で囲まれているかどうかにかかわらず適用されます。
+ フィールド内のテキストに二重引用符 (") が含まれている場合は、二重引用符でエスケープする必要があります。たとえば、次のようなテキストがあるとします。

  ```
  34" monitor
  ```

  次のように記述する必要があります。

  ```
  34"" monitor
  ```
+ 入力ファイルの処理中、空である、またはホワイトスペースしかないフィールドが発生した場合は、Amazon Translate では特定の行またはフィールドがスキップされます。
  + ソーステキストフィールドが空である場合、Amazon Translate ではそのフィールドが占有している行がスキップされます。
  + ターゲット翻訳フィールドが空白である場合、Amazon Translate ではそのフィールドだけがスキップされます。
+ 入力ファイルの処理中、空である、または 1000 バイトを超えているフィールドが発生した場合は、Amazon Translate では特定の行またはフィールドがスキップされます。
  + あるソーステキストフィールドが上記のバイト上限を超えている場合、Amazon Translate ではそのフィールドが占有している行がスキップされます。
  + あるターゲット翻訳フィールドが上記のバイト上限を超えている場合、Amazon Translate ではそのフィールドだけがスキップされます。
+ ソーステキストが同じである複数のレコードが入力ファイルに含まれている場合、Amazon Translate ではそのファイルの最後に最も近いレコードが使用されます。

------
#### [ TSV ]

次のサンプル TSV ファイルでは、Amazon Translate で使用できる形式で並列データが定義されています。このファイルでは、英語 (`en`) がソース言語です。スペイン語 (`es`) と中国語 (`zh`) がターゲット言語です。バッチジョブの出力を調整するために Amazon Translate で並列データの入力ファイルとして使用できるいくつかの例が提示されています。

**Example TSV 入力ファイル**  

```
en	es	zh
Amazon Translate is a neural machine translation service.	Amazon Translate es un servicio de traducción automática basado en redes neuronales.	Amazon Translate 是一项神经机器翻译服务。
Neural machine translation is a form of language translation automation that uses deep learning models.	La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.	神经机器翻译使用深度学习模型，是一种语言翻译自动化的形式。
Amazon Translate allows you to localize content for international users.	Amazon Translate le permite localizar contenido para usuarios internacionales.	Amazon Translate 允许您为国际用户本地化内容。
```

**TSV 要件**

TSV ファイルで並列データを定義する場合は、Amazon Translate の次の要件に注意してください。
+ 1 行目は言語コードで構成されます。最初のコードはソース言語で、後続の各コードはターゲット言語です。
+ 1 列目の各フィールドにはソーステキストが記載されています。後続の列の各フィールドにはターゲット翻訳が記載されています。
+ いずれかのフィールドのテキストにタブ文字が含まれている場合、そのテキストを二重引用符 (") で囲む必要があります。
+ テキストフィールドを複数の行に渡って表示することはできません。
+ フィールドの最初の文字として \$1、-、=、@ は使用できません。この要件は、フィールドが二重引用符 (") で囲まれているかどうかにかかわらず適用されます。
+ フィールド内のテキストに二重引用符 (") が含まれている場合は、二重引用符でエスケープする必要があります。たとえば、次のようなテキストがあるとします。

  ```
  34" monitor
  ```

  次のように記述する必要があります。

  ```
  34"" monitor
  ```
+ 入力ファイルの処理中、空である、またはホワイトスペースしかないフィールドが発生した場合は、Amazon Translate では特定の行またはフィールドがスキップされます。
  + ソーステキストフィールドが空である場合、Amazon Translate ではそのフィールドが占有している行がスキップされます。
  + ターゲット翻訳フィールドが空白である場合、Amazon Translate ではそのフィールドだけがスキップされます。
+ 入力ファイルの処理中、空である、または 1000 バイトを超えているフィールドが発生した場合は、Amazon Translate では特定の行またはフィールドがスキップされます。
  + あるソーステキストフィールドが上記のバイト上限を超えている場合、Amazon Translate ではそのフィールドが占有している行がスキップされます。
  + あるターゲット翻訳フィールドが上記のバイト上限を超えている場合、Amazon Translate ではそのフィールドだけがスキップされます。
+ ソーステキストが同じである複数のレコードが入力ファイルに含まれている場合、Amazon Translate ではそのファイルの最後に最も近いレコードが使用されます。

------