

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 建立saurus 檔案
<a name="index-synonyms-creating-thesaurus-file"></a>

 Amazon Kendra Thesaurus 檔案是 UTF-8-encoded的檔案，其中包含 Solr 同義詞清單格式的同義詞清單。Thesaurus 檔案必須小於 5 MB。

有兩種方式可以指定同義詞映射：
+ *雙向同義詞*指定為逗號分隔的詞彙清單。如果您的使用者查詢任何詞彙，則會使用清單中的所有詞彙來搜尋文件，其中包含原始查詢詞彙。
+ *單向同義*詞指定為以符號 "=>" 分隔的詞彙，以將詞彙映射至其同義詞。如果您的使用者在符號 "=>" 的左側查詢字詞，則會將其映射至右側的字詞，以使用同義詞搜尋文件。反之亦然，它不會映射，因此是單向的。

同義詞本身區分大小寫，但它們映射到的術語不區分大小寫。例如， `ML => Machine Learning`表示如果您的使用者查詢「ML」或「ml」或使用其他一些案例，它會映射到「Machine Learning」。如果您要映射此反之亦然，`Machine Learning => ML`則「Machine Learning」或「機器學習」或其他一些案例會映射到「ML」。

同義詞不會搜尋特殊字元的完全相符項目。例如，如果您搜尋 "dead-letter-queue"， Amazon Kendra 可以傳回符合 "dead letter queue" （無連字號） 的文件。如果您的文件包含連字號，例如 "dead-letter-queue"， 會在搜尋期間 Amazon Kendra 處理文件以移除連字號。對於內建於 Amazon Kendra 且不應包含在 saurus 檔案中的一般英文同義詞詞彙， Amazon Kendra 可以搜尋該詞彙的連字號版本和非連字號版本。例如，如果您搜尋「第三方」和「第三方」， 會 Amazon Kendra 傳回符合任一版本這些條款的文件。

對於包含停止詞或常用單字的同義詞， Amazon Kendra 會傳回符合字詞的文件，包括停止詞。例如，您可以建立同義詞規則來映射「加入中」和「加入中」。同義詞不能單獨使用停止詞。例如，如果您搜尋 "on"， Amazon Kendra 則無法傳回包含 "on" 的所有文件。

某些同義詞規則會被忽略。例如， `a => b` 是規則，但`a => a`會被忽略且不算作規則。

術語計數是 theaurus 檔案中唯一術語的數目。以下範例檔案包含 `AWS CodeStar`、`ML`、`Machine Learning`、`ASG`、 `autoscaling group`等詞彙。

每個詞庫的同義詞規則數量上限，以及每個詞彙的同義詞數量上限。如需詳細資訊，請參閱[的配額 Amazon Kendra](quotas.md)。

下列範例顯示具有同義詞規則的saurus 檔案。每行都包含單一同義詞規則。忽略空白行和註解。

```
# Lines starting with pound are comments and blank lines are ignored.

# Synonym relationships can be defined as unidirectional or bidirectional relationships.

# Unidirection relationships are represented by any term sequence 
# on the left hand side (LHS) of "=>" followed by synonyms on the right hand side (RHS)
CodeStar => AWS CodeStar
# This will map CodeStar to AWS CodeStar, but not vice-versa

# To map terms vice versa
ML => Machine Learning
Machine Learning => ML

# Multiple synonym relationships may be defined in one line as well by comma seperation.
autoscaling group, ASG => Auto Scaling group, autoscaling
# The above is equivalent to:
# autoscaling group => Auto Scaling group, autoscaling
# ASG => Auto Scaling group, autoscaling

# Bi-directional synonyms are comma separated terms with no "=>"
DNS, Route53, Route 53
# DNS, Route53, and Route 53 map to one another and are interchangeable at match time
# The above is equivalent to:
# DNS => Route53, Route 53
# Route53 => DNS, Route 53
# Route 53 => DNS, Route53

# Overlapping LHS terms will be merged
Beta => Alpha
Beta => Gamma
Beta, Delta
# is equivalent to:
# Beta => Alpha, Gamma, Delta
# Delta => Beta

# Each line contains a single synonym rule.
# Synonym rule count is the total number of lines defining synonym relationships
# Term count is the total number of unique terms for all rules.  
# Comments and blanks lines do not count.
```