

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# File input data paralel untuk Amazon Translate
<a name="customizing-translations-parallel-data-input-files"></a>

Sebelum Anda dapat membuat sumber daya data paralel di Amazon Translate, Anda harus membuat file input yang berisi contoh terjemahan Anda. File input data paralel Anda harus menggunakan bahasa yang didukung Amazon Translate. Untuk daftar bahasa-bahasa ini, lihat[Bahasa dan kode bahasa yang didukung](what-is-languages.md).

## Contoh data parallel
<a name="customizing-translations-parallel-data-input-files-example-pd"></a>

Teks dalam tabel berikut memberikan contoh segmen terjemahan yang dapat diformat menjadi file input data paralel:


| id | es | zh | 
| --- | --- | --- | 
|  Amazon Translate adalah layanan terjemahan mesin saraf.  |  Amazon Translate adalah servicio de traducción automática basado en redes neuronales.  |  Amazon Translate。  | 
|  Terjemahan mesin saraf adalah bentuk otomatisasi terjemahan bahasa yang menggunakan model pembelajaran mendalam.  |  Terjemahan otomatis neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.  |  ，动。  | 
|  Amazon Translate memungkinkan Anda melokalkan konten untuk pengguna internasional.  |  Amazon Translate dan permite localizar contenido untuk pengguna internacionales.  |  Amazon Translate  | 

Baris pertama tabel menyediakan kode bahasa. Bahasa pertama, English (en), adalah bahasa sumber. Bahasa Spanyol (es) dan China (zh) adalah bahasa target. Kolom pertama memberikan contoh teks sumber. Kolom lainnya berisi contoh terjemahan. Saat data paralel ini menyesuaikan pekerjaan batch, Amazon Translate mengadaptasi terjemahan untuk mencerminkan contoh. 

## Format file masukan
<a name="customizing-translations-parallel-data-input-files-formats"></a>

Amazon Translate mendukung format berikut untuk file input data paralel:
+ Memori Terjemahan eXchange (TMX)
+ Nilai yang dipisahkan koma (CSV)
+ Nilai yang dipisahkan tab (TSV)

------
#### [ TMX ]



**Example File masukan TMX**  
Contoh file TMX berikut mendefinisikan data paralel dalam format yang diterima Amazon Translate. Dalam file ini, English (`en`) adalah bahasa sumber. Bahasa Spanyol (`es`) dan Mandarin (`zh`) adalah bahasa target. Sebagai file input untuk data paralel, ini menyediakan beberapa contoh yang dapat digunakan Amazon Translate untuk menyesuaikan output dari pekerjaan batch.  

```
<?xml version="1.0" encoding="UTF-8"?>
<tmx version="1.4">
    <header srclang="en"/>
    <body>
        <tu>
            <tuv xml:lang="en">
                <seg>Amazon Translate is a neural machine translation service.</seg>
            </tuv>
            <tuv xml:lang="es">
                <seg>Amazon Translate es un servicio de traducción automática basado en redes neuronales.</seg>
            </tuv>
            <tuv xml:lang="zh">
                <seg>Amazon Translate 是一项神经机器翻译服务。</seg>
            </tuv>
        </tu>
        <tu>
            <tuv xml:lang="en">
                <seg>Neural machine translation is a form of language translation automation that uses deep learning models.</seg>
            </tuv>
            <tuv xml:lang="es">
                <seg>La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.</seg>
            </tuv>
            <tuv xml:lang="zh">
                <seg>神经机器翻译使用深度学习模型，是一种语言翻译自动化的形式。</seg>
            </tuv>
        </tu>
        <tu>
            <tuv xml:lang="en">
                <seg>Amazon Translate allows you to localize content for international users.</seg>
            </tuv>
            <tuv xml:lang="es">
                <seg>Amazon Translate le permite localizar contenido para usuarios internacionales.</seg>
            </tuv>
            <tuv xml:lang="zh">
                <seg>Amazon Translate 允许您为国际用户本地化内容。</seg>
            </tuv>
        </tu>
    </body>
</tmx>
```

**Persyaratan TMX**

Ingat persyaratan berikut dari Amazon Translate saat Anda menentukan data paralel dalam file TMX:
+ Amazon Translate mendukung TMX 1.4b. Untuk informasi lebih lanjut, lihat [spesifikasi TMX 1.4b](https://www.gala-global.org/tmx-14b#SectionReferences) di situs web Globalization and Localization Association.
+ `header`Elemen harus menyertakan `srclang` atribut. Nilai atribut ini menentukan bahasa sumber data paralel.
+ `body`Elemen harus mengandung setidaknya satu unit terjemahan (`tu`) elemen.
+ Setiap `tu` elemen harus mengandung setidaknya dua elemen varian unit terjemahan (`tuv`). Salah satu `tuv` elemen ini harus memiliki `xml:lang` atribut yang memiliki nilai yang sama dengan yang ditetapkan ke `srclang` atribut dalam `header` elemen.
+ Semua `tuv` elemen harus memiliki `xml:lang` atribut.
+ Semua `tuv` elemen harus memiliki elemen segmen (`seg`).
+ Saat memproses file input Anda, Amazon Translate melewatkan `tuv` elemen tertentu `tu` atau jika menemukan `seg` elemen yang kosong atau hanya berisi spasi putih:
  + Jika `seg` elemen sesuai dengan bahasa sumber, Amazon Translate melewatkan `tu` elemen yang ditempati `seg` elemen tersebut.
  + Jika `seg` elemen sesuai dengan bahasa target, Amazon Translate hanya melewatkan `tuv` elemen yang ditempati `seg` elemen tersebut.
+ Saat memproses file input Anda, Amazon Translate melewatkan `tuv` elemen tertentu `tu` atau jika menemukan `seg` elemen yang melebihi 1000 byte:
  + Jika `seg` elemen sesuai dengan bahasa sumber, Amazon Translate melewatkan `tu` elemen yang ditempati `seg` elemen tersebut.
  + Jika `seg` elemen sesuai dengan bahasa target, Amazon Translate hanya melewatkan `tuv` elemen yang ditempati `seg` elemen tersebut.
+ Jika file input berisi beberapa `tu` elemen dengan teks sumber yang sama, Amazon Translate melakukan salah satu hal berikut:
  + Jika `tu` elemen memiliki `changedate` atribut, ia menggunakan elemen dengan tanggal terbaru.
  + Jika tidak, ia menggunakan elemen yang terjadi paling dekat dengan akhir file.

------
#### [ CSV ]

Contoh file CSV berikut mendefinisikan data paralel dalam format yang diterima Amazon Translate. Dalam file ini, English (`en`) adalah bahasa sumber. Bahasa Spanyol (`es`) dan Mandarin (`zh`) adalah bahasa target. Sebagai file input untuk data paralel, ini menyediakan beberapa contoh yang dapat digunakan Amazon Translate untuk menyesuaikan output dari pekerjaan batch.

**Example File masukan CSV**  

```
en,es,zh
Amazon Translate is a neural machine translation service.,Amazon Translate es un servicio de traducción automática basado en redes neuronales.,Amazon Translate 是一项神经机器翻译服务。
Neural machine translation is a form of language translation automation that uses deep learning models.,La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.,神经机器翻译使用深度学习模型，是一种语言翻译自动化的形式。
Amazon Translate allows you to localize content for international users.,Amazon Translate le permite localizar contenido para usuarios internacionales.,Amazon Translate 允许您为国际用户本地化内容。
```

**Persyaratan CSV**

Ingat persyaratan berikut dari Amazon Translate saat Anda menentukan data paralel dalam file CSV:
+ Baris pertama terdiri dari kode bahasa. Kode pertama adalah bahasa sumber, dan setiap kode berikutnya adalah bahasa target.
+ Setiap bidang di kolom pertama berisi teks sumber. Setiap bidang di kolom berikutnya berisi terjemahan target.
+ Jika teks dalam bidang apapun berisi koma, teks harus diapit dalam karakter tanda kutip ganda (“).
+ Bidang teks tidak dapat menjangkau beberapa baris.
+ Bidang tidak dapat dimulai dengan karakter berikut: \$1, -, =, @. Persyaratan ini berlaku apakah bidang tersebut terlampir dalam tanda kutip ganda (“).
+ Jika teks dalam bidang berisi kutipan ganda (“), itu harus diloloskan dengan tanda kutip ganda. Misalnya, teks seperti:

  ```
  34" monitor
  ```

  Harus ditulis sebagai:

  ```
  34"" monitor
  ```
+ Saat memproses file input Anda, Amazon Translate akan melewati baris atau bidang tertentu jika menemukan bidang yang kosong atau hanya berisi spasi putih:
  + Jika bidang teks sumber kosong, Amazon Translate melewatkan baris yang ditempati.
  + Jika bidang terjemahan target kosong, Amazon Translate hanya melewatkan bidang itu.
+ Saat memproses file input Anda, Amazon Translate melewatkan baris atau bidang tertentu jika menemukan bidang yang melebihi 1000 byte:
  + Jika bidang teks sumber melebihi batas byte, Amazon Translate melewatkan baris yang ditempati.
  + Jika bidang terjemahan target melebihi batas byte, Amazon Translate hanya melewatkan bidang itu.
+ Jika file input berisi beberapa catatan dengan teks sumber yang sama, Amazon Translate menggunakan catatan yang terjadi paling dekat dengan akhir file.

------
#### [ TSV ]

Contoh berikut file TSV mendefinisikan data paralel dalam format yang diterima Amazon Translate. Dalam file ini, English (`en`) adalah bahasa sumber. Bahasa Spanyol (`es`) dan Mandarin (`zh`) adalah bahasa target. Sebagai file input untuk data paralel, ini menyediakan beberapa contoh yang dapat digunakan Amazon Translate untuk menyesuaikan output dari pekerjaan batch.

**Example File masukan TSV**  

```
en	es	zh
Amazon Translate is a neural machine translation service.	Amazon Translate es un servicio de traducción automática basado en redes neuronales.	Amazon Translate 是一项神经机器翻译服务。
Neural machine translation is a form of language translation automation that uses deep learning models.	La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.	神经机器翻译使用深度学习模型，是一种语言翻译自动化的形式。
Amazon Translate allows you to localize content for international users.	Amazon Translate le permite localizar contenido para usuarios internacionales.	Amazon Translate 允许您为国际用户本地化内容。
```

**Persyaratan TSV**

Ingat persyaratan berikut dari Amazon Translate saat Anda menentukan data paralel dalam file TSV:
+ Baris pertama terdiri dari kode bahasa. Kode pertama adalah bahasa sumber, dan setiap kode berikutnya adalah bahasa target.
+ Setiap bidang di kolom pertama berisi teks sumber. Setiap bidang di kolom berikutnya berisi terjemahan target.
+ Jika teks di bidang apa pun berisi karakter tab, teks harus diapit dengan karakter kutipan ganda (“).
+ Bidang teks tidak dapat menjangkau beberapa baris.
+ Bidang tidak dapat dimulai dengan karakter berikut: \$1, -, =, @. Persyaratan ini berlaku apakah bidang tersebut terlampir dalam tanda kutip ganda (“).
+ Jika teks dalam bidang berisi kutipan ganda (“), itu harus diloloskan dengan tanda kutip ganda. Misalnya, teks seperti:

  ```
  34" monitor
  ```

  Harus ditulis sebagai:

  ```
  34"" monitor
  ```
+ Saat memproses file input Anda, Amazon Translate melewatkan baris atau bidang tertentu jika menemukan bidang yang kosong atau hanya berisi spasi putih:
  + Jika bidang teks sumber kosong, Amazon Translate melewatkan baris yang ditempati.
  + Jika bidang terjemahan target kosong, Amazon Translate hanya melewatkan bidang itu.
+ Saat memproses file input Anda, Amazon Translate melewatkan baris atau bidang tertentu jika menemukan bidang yang melebihi 1000 byte:
  + Jika bidang teks sumber melebihi batas byte, Amazon Translate melewatkan baris yang ditempati.
  + Jika bidang terjemahan target melebihi batas byte, Amazon Translate hanya melewatkan bidang itu.
+ Jika file input berisi beberapa catatan dengan teks sumber yang sama, Amazon Translate menggunakan catatan yang terjadi paling dekat dengan akhir file.

------