

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 让 Quick Sight 话题自然而然适合语言
<a name="topics-natural-language"></a>


|  | 
| --- |
|  适用于：企业版  | 


|  | 
| --- |
|    目标受众：Amazon Quick 管理员和作者  | 

创建主题时，Quick Sight 会创建、存储和维护一个索引，其中包含该主题中数据的定义。此索引用于生成正确答案，在有人提问时提供自动完成建议，以及建议术语与列或数据值的映射。这就是如何在读者的提问中解释关键术语并将其映射到您的数据中。

为了帮助解释您的数据并更好地回答读者的问题，请尽可能多地提供有关您的数据集及其相关字段的信息。

使用以下过程进行此操作，使主题适合使用自然语言。

**提示**  
您可以使用批量操作一次编辑多个字段。按照以下步骤批量编辑主题中的字段。

**批量编辑主题中的字段**

1. 打开要更改的主题。

1. 在主题中，选择**数据**选项卡。

1. 在**字段**下，选择要更改的两个或多个字段。

1. 选择列表顶部的**批量操作**。

1. 在打开的**批量操作**页面中，根据需要配置字段，然后选择**应用于**。

   以下步骤描述了配置选项。

## 步骤 1：为数据集提供易记名称和描述
<a name="topics-natural-language-dataset-name"></a>

数据集名称通常基于技术命名约定，读者可能不会自然使用这些约定来引用名称。我们建议您为数据集提供易记名称和描述，以提供有关其所包含数据的更多信息。这些友好的名称和描述用于理解数据集内容并根据读者的问题选择数据集。还会向读者显示数据集名称，以便为答案提供更多背景信息。

例如，如果您的数据集命名为 `D_CUST_DLY_ORD_DTL`，则可以在主题中将其重命名为 `Customer Daily Order Details`。这样，当您的读者看到您的主题的搜索栏中列出的数据时，他们可以快速确定数据是否与他们相关。

**为数据集指定易记名称和描述**

1. 打开要更改的主题。

1. 在**摘要**选项卡上，选择**数据**。然后，在 “**数据集**” 下，选择数据集最右侧的向下箭头将其展开。

1. 选择左侧数据集名称旁边的铅笔图标，然后输入一个易记名称。我们建议使用读者能理解的名称。

1. 对于**描述**，输入数据集的描述，以描述数据集所包含的数据。

## 步骤 2：指导如何在数据集中使用日期字段
<a name="topics-natural-language-dataset-time-basis"></a>

如果您的数据集包含日期和时间信息，我们建议您在回答问题时指导如何使用这些信息。如果主题中有多个日期时间列，则这样做尤其重要。

在某些情况下，主题中有多个有效的日期列，例如订单日期和发货日期。在这些情况下，您可以通过指定用于回答问题的默认日期来帮助读者。如果默认日期无法回答他们的问题，则读者可以选择其他日期。

您还可以通过指定时间基准来判断日期时间列的精细程度。数据集的*时间基准*是数据集中所有度量都支持的最低级时间粒度。此设置有助于聚合数据集中不同时间维度的指标，并且适用于支持单一日期时间粒度的数据集。可以为具有大量指标的非规范化数据集设置此选项。例如，如果一个数据集在每日聚合中支持多个指标，则可以将该数据集的时间基准设置为**每日**。然后使用它来确定如何汇总指标。

**为数据集设置默认日期和时间基准**

1. 打开要更改的主题。

1. 在**摘要**选项卡上，选择**数据**。然后，在 “**数据集**” 下，选择数据集最右侧的向下箭头将其展开。

1. 对于**默认日期**，选择一个日期字段。

1. 对于**时间基准**，选择要将数据集中的指标聚合到的最低粒度级别。您可以按每日、每周、每月、每季度或每年级别聚合主题中的指标。

## 步骤 3：排除未使用的字段
<a name="topics-natural-language-exclude-fields"></a>

将数据集添加到主题时，默认情况下会添加数据集中的所有列（字段）。如果您的数据集包含您或您的读者不使用的字段，或者您不想在答案中包含的字段，则可以将其排除在主题之外。排除这些字段会将其从答案和索引中删除，从而提高读者收到的答案的准确性。

**排除主题中的字段**

1. 打开要更改的主题。

1. 在主题中，选择**数据**选项卡。

1. 在**字段**部分的**包含**下，关闭图标。

## 步骤 4：将字段重命名为适合使用自然语言的名称
<a name="topics-natural-language-rename-fields"></a>

数据集中的字段通常根据技术命名约定命名。您可以通过重命名字段名称并添加描述，使主题中的字段名称更加便于用户记忆。

字段名称用于理解这些字段，并将它们与读者提问中的术语相关联。当您的字段名称易于使用时，可以更轻松地在数据和读者的问题之间建立联系。这些易记名称也作为问题答案的一部分呈现给读者，以提供更多的上下文信息。

**重命名字段并添加描述**

1. 打开要更改的主题。

1. 在主题中，选择**数据**选项卡。

1. 在**字段**部分中，选择字段最右侧的向下箭头将其展开。

1. 选择左侧字段名称旁边的铅笔图标，然后输入一个易记名称。

1. 对于**描述**，输入字段描述。

## 步骤 5：将同义词添加到字段和字段值
<a name="topics-natural-language-synonyms"></a>

即使您更新字段名称以方便用户记忆并为其提供描述，读者仍可能使用不同的名称来指代它们。例如，在读者的问题中，`Sales` 字段可能称为 `revenue`、`rev` 或 `spending`。

为了帮助理解这些术语并将其映射到正确的字段，您可以在字段中添加一个或多个同义词。这样做可以提高准确性。

与字段名称一样，读者可能会使用不同的名称来指代字段中的特定值。例如，如果您有一个包含值 `NW`、`SE`、`NE` 和 `SW` 的字段，则可以为这些值添加同义词。您可以为 `NW` 添加 `Northwest`，为 `SE` 添加 `Southeast`。

**为字段添加同义词**

1. 打开要更改的主题。

1. 在主题中，选择**数据**选项卡。

1. 在**字段**部分的**同义词**下，请选择字段的铅笔图标，输入单词或短语，然后按键盘上的 Enter。要添加其他同义词，请选择 **\+** 图标。

**为字段中的值添加同义词**

1. 打开要更改的主题。

1. 在主题中，选择**数据**选项卡。

1. 在**字段**部分中，选择最右侧的向下箭头以展开有关字段的信息。

1. 在右侧的**值预览**下，选择**配置值同义词**。

1. 在打开的**字段值同义词**页面上，选择**添加**，然后执行以下操作：

   1. 对于**值**，选择要为其添加同义词的值。

   1. 对于**同义词**，为该值输入一个或多个同义词。

1. 选择**保存**。

1. 要为其他值添加同义词，请重复步骤 5-6。

1. 完成后，选择**完成**。

## 第 6 步：详细说明您的字段
<a name="topics-natural-language-semantics"></a>

为了帮助解释如何使用您的数据来回答读者的问题，您可以详细解释数据集中的字段。

您可以说出数据集中的字段是维度还是度量，并指定应如何聚合该字段。您还可以阐明应如何格式化字段中的值以及该字段中的数据类型。配置这些附加设置有助于在读者提问时为他们创建准确的答案。

使用以下过程详细说明您的字段。

### 分配字段角色
<a name="topics-natural-language-semantics-role"></a>

数据集中的每个字段要么是维度，要么是度量。*维度*是分类数据，*度量*是量化数据。知道字段是维度还是度量决定了可以对字段执行哪些操作和不能执行哪些操作。

例如，设置字段`Patient ID``Employee ID`、和`Ratings`有助于将这些字段解释为整数。此设置意味着字段在测量时不会被聚合。

**设置字段角色**

1. 打开要更改的主题。

1. 在主题中，选择**数据**选项卡。

1. 在**字段**部分中，选择最右侧的向下箭头以展开有关字段的信息。

1. 对于**角色**，选择一个角色。

   您可以选择度量或维度。

1. （可选）如果您的度量成反比（例如，数字越小越好），请选择**反向度量**。

   这说明了如何解释和显示此字段中的值。

### 设置字段聚合
<a name="topics-natural-language-semantics-aggregation"></a>

设置字段聚合有助于确定当这些字段跨多行聚合时，应该使用或不应该使用哪个函数。您可以为字段设置默认聚合和不允许的聚合。

*默认聚合*是读者的问题中没有提及或标识明确的聚合函数时应用的聚合。例如，假设您的一位读者问：“昨天售出了多少产品？” 在此例中，Q 使用默认聚合为 `count distinct` 的字段 `Product ID` 来回答问题。这样做会生成一个视觉对象，其中显示产品 ID 的不同数量。

*不允许的聚合*是被排除在外、不用于在字段上回答问题的聚合。即使问题明确要求不允许的聚合，也会将其排除在外。例如，假设您指定 `Product ID` 字段永远不按 `sum` 进行聚合。即使你的一个读者问：“昨天总共售出了多少产品？” `sum` 不是用来回答这个问题的。

如果在字段上错误地应用了聚合函数，我们建议您为该字段设置不允许的聚合。

**设置字段聚合**

1. 打开要更改的主题。

1. 在主题中，选择**数据**选项卡。

1. 在**字段**部分中，选择最右侧的向下箭头以展开有关字段的信息。

1. 对于**默认聚合**，选择要在默认情况下聚合字段的聚合。

   您可以按总和、平均值、最大值和最小值聚合度量。您可以按计数和不同计数来聚合维度。

1. （可选）对于 “**不允许的**聚合”，请选择您不想使用的聚合。

1. （可选）如果您不想在筛选器中聚合该字段，请选择 “**从不在筛选器中聚合**”。

### 指定如何格式化字段值
<a name="topics-natural-language-semantics-values"></a>

如果你想解释如何格式化字段中的值，你可以这样做。例如，假设您有该字段`Order Sales Amount`，其中包含要格式化为.dollars 的值 U.S。在这种情况下，你可以解释在答案中使用时如何将字段中的值格式化为 U.S .currency。

**指定如何格式化字段值**

1. 打开要更改的主题。

1. 在主题中，选择**数据**选项卡。

1. 在**字段**部分中，选择最右侧的向下箭头以展开有关字段的信息。

1. 对于**值格式**，选择格式化字段中值的方式。

### 指定字段语义类型
<a name="topics-natural-language-semantics-types"></a>

字段*语义类型*是字段中数据所表示的信息类型。例如，您可能有一个包含位置数据、货币数据、年龄数据或布尔数据的字段。您可以为字段指定语义类型和其他语义子类型。指定这些内容有助于理解存储在字段中的数据的含义。

使用以下过程指定字段语义类型和子类型。

**指定字段语义类型**

1. 打开要更改的主题。

1. 在主题中，选择**数据**选项卡。

1. 在**字段**部分中，选择最右侧的向下箭头以展开有关字段的信息。

1. 对于**语义类型**，选择数据表示的信息类型。

   对于度量，您可以选择持续时间、日期部分、位置、布尔值、货币、百分比、年龄、距离和标识符类型。对于维度，您可以选择日期部分、位置、布尔值、人员、组织和标识符类型。

1. 对于**语义子类型**，选择选项以进一步指定数据表示的信息类型。

   此处的选项取决于您选择的语义类型以及与该字段关联的角色。有关度量和维度的语义类型及其关联子类型的列表，请参阅下表。


| 语义类型 | 语义子类型 | 适用于以下对象 | 
| --- | --- | --- | 
| 天数 |  | 度量 | 
| 布尔值 |  | 维度和度量 | 
| 货币 | USD<br />欧元<br />GBP | 度量 | 
| 日期部分 | 天<br />周<br />Month<br />Year<br />季度 | 维度和度量 | 
| 距离 | 公里<br />计量器<br />码<br />英尺 | 度量 | 
| Duration | 秒<br />分钟<br />小时<br />天 | 度量 | 
| 标识符 |  | 维度和度量 | 
| 位置 | 邮政编码<br />Country（国家/地区）<br />州<br />City（城市） | 维度和度量 | 
| Organization（组织） |  | Dimensions | 
| 百分比 |  | 度量 | 
| 人员 |  | Dimensions | 