

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 地址验证
<a name="address-validation-concepts"></a>

地址验证作业处理地址数据以验证和标准化地址。该服务支持自由格式的地址行和结构化地址组件，并且可以选择使用地理坐标和特定国家/地区的邮政属性来增强结果。

地址验证支持来自以下国家/地区的地址：澳大利亚、加拿大、英国和美国。

## 地址验证功能
<a name="address-validation-features"></a>

地址验证提供以下用于验证和增强地址数据的功能：

**地址标准化**  
地址验证通过对照权威地址数据集检查地址来验证地址是否存在并且可以送达。地址标准化格式根据官方邮政标准（例如一致的缩写、大小写和标点符号）来格式化地址。它还可以纠正诸如拼写错误之类的错误，并添加缺失的地址组成部分，例如邮政编码和街道名称。

**增强验证**  
地址验证作业支持可选的附加功能，这些功能可以增强验证结果：  
+ **位置**-返回已验证地址的地理坐标（经度和纬度），使您能够绘制地址地图或执行地理分析。此功能仅在美国、加拿大和澳大利亚提供，并且会产生额外费用。
+ **CountrySpecificAttributes**— 提供特定于每个国家的邮政系统信息。例如，美国地址接收 USPS 数据，例如送货点代码和承运人路线信息，而澳大利亚地址则接收澳大利亚邮政标识符。
有关定价的更多信息，请参阅[职位定价](jobs-pricing.md)。

## 地址验证用例
<a name="address-validation-use-cases"></a>

**医疗保健系统和保险公司**  
验证患者和提供者的地址，以满足索赔处理、护理协调和监管报告要求。

**金融服务和保险公司**  
标准化客户地址，以支持身份验证工作流程、风险评估和欺诈防范。

**零售和电子商务运营**  
清理客户数据库以减少配送失败、提高配送率并优化配送成本。

**运输和物流提供商**  
验证配送地址以优化路线，减少最后一英里运营中失败的配送。

**数据迁移和数据库维护**  
在系统转换期间执行一次性数据库清理，并定期验证地址记录以保持数据质量。

**分析、报告和实体解析**  
通过实体解析工作流程，实现基于位置的分析、人口统计分析和客户关系管理 (CRM) 数据库清理的标准化地址。

## 输入架构
<a name="address-validation-input-schema"></a>

地址验证作业需要具有特定架构的输入数据。该架构支持自由格式的地址行和结构化地址组件，允许您以最符合您的数据的格式提交地址。

输入架构包括以下字段：

Id  
为该输入记录提供的可选标识符。如果提供，则会在输出文件中进行镜像，`Input_Id`以帮助您将输出记录与其对应的输入关联起来。

地址行  
使用 th `AddressLines_1` rou `AddressLines_5` gh 获取自由格式的地址。在中输入单行输入。`AddressLines_1`根据地区邮政规则订购多行输入，就像它们在邮件中显示的那样。

AddressComponents\_国家  
地址所在国家/地区的 alpha-2、alpha-3 字符代码或全名。

AddressComponents\_区域  
输入地址的区域，例如州、省或领地。

AddressComponents\_SubRegion  
输入地址的子区域，例如县。

AddressComponents\_Locality  
输入地址的地点，例如城市或城镇。

AddressComponents\_PostalCode  
输入地址的邮政编码。

AddressComponents\_Street  
输入地址的街道名称。

AddressComponents\_AddressNumber  
输入地址的地址或门牌号。

AddressComponents\_Unit  
输入地址的单位。

AddressComponents\_UnitDesignator  
输入地址的单位标识符或类型，例如 Apt、Suite 或 \#。

**注意**  
在请求 AddressComponents 中同时使用 AddressLines 和时，请在中输入第一行地址组成部分（AddressNumber、街道、单位和 UnitDesignator）。 AddressLines输入最后一行组件（地点、地区、 SubRegion、国家/地区和 PostalCode） AddressComponents

### 用于创建输入数据的示例 Python 脚本
<a name="address-validation-input-sample"></a>

以下 Python 脚本创建了一个包含地址数据的示例 Parquet 文件：

```
import pyarrow as pa
import pyarrow.parquet as pq

data = [
    {
        "Id": "record-001",
        "AddressLines_1": "Pike Place",
        "AddressLines_2": "Apartment 4B",
        "AddressLines_3": None,
        "AddressLines_4": None,
        "AddressLines_5": None,
        "AddressComponents_Country": "USA",
        "AddressComponents_Region": None,
        "AddressComponents_SubRegion": None,
        "AddressComponents_Locality": None,
        "AddressComponents_PostalCode": "98101",
        "AddressComponents_Street": None,
        "AddressComponents_AddressNumber": None,
        "AddressComponents_Unit": None,
        "AddressComponents_UnitDesignator": None
    },
    {
        "Id": "record-002",
        "AddressLines_1": "2901 E Madison St",
        "AddressLines_2": None,
        "AddressLines_3": None,
        "AddressLines_4": None,
        "AddressLines_5": None,
        "AddressComponents_Country": "USA",
        "AddressComponents_Region": None,
        "AddressComponents_SubRegion": None,
        "AddressComponents_Locality": None,
        "AddressComponents_PostalCode": "98112",
        "AddressComponents_Street": None,
        "AddressComponents_AddressNumber": None,
        "AddressComponents_Unit": None,
        "AddressComponents_UnitDesignator": None
    }
]

schema = pa.schema([
    ("Id", pa.string()),
    ("AddressLines_1", pa.string()),
    ("AddressLines_2", pa.string()),
    ("AddressLines_3", pa.string()),
    ("AddressLines_4", pa.string()),
    ("AddressLines_5", pa.string()),
    ("AddressComponents_Country", pa.string()),
    ("AddressComponents_Region", pa.string()),
    ("AddressComponents_SubRegion", pa.string()),
    ("AddressComponents_Locality", pa.string()),
    ("AddressComponents_PostalCode", pa.string()),
    ("AddressComponents_Street", pa.string()),
    ("AddressComponents_AddressNumber", pa.string()),
    ("AddressComponents_Unit", pa.string()),
    ("AddressComponents_UnitDesignator", pa.string())
])

table = pa.Table.from_pylist(data, schema=schema)
pq.write_table(table, 'addresses.parquet')
```

有关文件大小限制，请参阅[准备输入数据](preparing-input-data.md)。

## 输出架构
<a name="address-validation-output-schema"></a>

地址验证作业生成的输出包括标准化地址组件、验证结果和可选的其他要素数据。以下各节描述了特定于地址验证的输出字段。

有关输出架构的一般信息以及如何检索结果，请参阅[检索工作结果](retrieving-results.md)。

### 输出地址字段
<a name="output-address-fields"></a>

带有`Output_`前缀的标准化地址组件，根据地区邮政规则进行格式化。

#### 输出地址字段的完整列表
<a name="output-address-fields-list"></a>

输出\_ AddressId  
返回地址的唯一标识符。

输出\_ \_1 AddressLines  
完整返回地址的第一行用多行写成，因为它应该出现在邮件中。它是根据地区邮政规则进行格式化的。

输出\_ \_2 AddressLines  
完整返回地址的第二行用多行写成，因为它应该出现在邮件中。它是根据地区邮政规则进行格式化的。

输出\_ \_3 AddressLines  
完整返回地址的第三行用多行写成，因为它应该出现在邮件中。它是根据地区邮政规则进行格式化的。

输出\_ \_4 AddressLines  
完整返回地址的第四行写在多行上，因为它应该出现在邮件中。它是根据地区邮政规则进行格式化的。

输出\_ \_5 AddressLines  
完整返回地址的第五行用多行写成，因为它应该出现在邮件中。它是根据地区邮政规则进行格式化的。

输出地址\_标签  
根据地区邮政规则，组装的地址由地址组成部分构成。

输出地址\_国家/地区\_代码2  
该国家/地区的 Alpha-2 字符代码。

输出地址\_国家/地区\_代码3  
该国家/地区的 Alpha-3 字符代码。

输出地址\_国家/地区\_名称  
国家的全名。

输出地址\_区域\_代码  
该地区的缩写代码。

输出地址\_区域\_名称  
该地区的全名。

输出\_地址\_ \_代码 SubRegion  
子区域的缩写代码。

输出\_地址\_ \_名称 SubRegion  
子区域的全名。

输出\_地址\_地点  
地址的位置部分，例如城市或城镇。

输出地址\_ PostalCode  
地址的完整邮政编码部分。

输出\_地址\_ \_ PostalCodeDetails Base  
邮政编码的基段。

输出\_地址\_ \_扩展名 PostalCodeDetails  
邮政编码的分机段或附加段。

输出\_地址\_街道  
地址的完整街道部分。

输出\_地址\_ \_ StreetComponents BaseName  
基本名称是街道名称的一部分。

输出\_地址\_ \_Pref StreetComponents ix  
位于道路基本名称之前但不包含在道路基本名称中的方向标识符。

输出\_地址\_ \_Suff StreetComponents ix  
跟随道路基本名称但不包含在道路基本名称中的方向标识符。

输出\_地址\_ \_类型 StreetComponents  
街道类型街道名称的一部分`ST`，例如、`AVE`、`BLVD`。

输出\_地址\_ \_ StreetComponents TypePlacement  
定义街道类型是在基本名称之前还是之后。 （`BeforeBaseName`或`AfterBaseName`）

输出地址\_ AddressNumber  
地址中的地址或门牌号部分。

输出\_地址\_ \_单位\_编号 SecondaryAddressComponents  
单位辅助地址组件的字母数字标识符。

输出\_地址\_ \_单位标识符 SecondaryAddressComponents  
单位辅助地址组件的标号，如地址标签中显示的那样。

输出\_地址\_ \_楼层\_号码 SecondaryAddressComponents  
楼层辅助地址组件的字母数字标识符。

输出\_地址\_ \_楼层\_标识符 SecondaryAddressComponents  
楼层辅助地址组件的标号，显示在地址标签中。

### 地址元数据
<a name="address-metadata"></a>

有关地址和配送特征的元数据。

Output\_ \_ \_Mailable AddressMetadata DeliveryIndicators  
表示地址是否可邮寄。值：`true`/`false`

输出\_ \_ \_ AddressMetadata 可定位 DeliveryIndicators  
表示地址是否可定位。值：`true`/`false`

### 验证结果
<a name="validation-results"></a>

地址的总体验证质量指标。

输出\_ \_ ValidationResults ValidationGranularity  
表示验证返回地址的总体粒度级别。值：  
+ `Premise`— 地址号码级别的所有组件都经过验证
+ `Street`— 街道上的所有组件都经过了验证
+ `LocalityAndPostalCode`— 验证了地点 PostalCode、和国家
+ `Locality`— 验证了地点和国家

输出\_ \_ ValidationResults MatchConfidence  
表示地址验证过程中执行的地址匹配的总体可信度。值：`High`、`MediumHigh`、`Medium`、`MediumLow`、`Low`

输出\_ \_ ValidationResults MatchConfidenceScore  
为比赛信心提供精确的分数。范围为 0-1.0，其中 1.0 表示完美匹配。

### 组件验证状态
<a name="component-validation-status"></a>

对于每个地址组成部分，有两个字段表示验证结果：
+ `Status`字段表示验证状态：`Validated`或 `Unconfirmed`
+ `StatusDetail`字段提供了有关验证状态的更多详细信息：
  + `NotFound`— 未找到组件或组件为空。
  + `StandardizedNoMatch`— 组件已被解析和标准化，但未在参考数据中识别。
  + `OutOfRange`— 未识别组件，参考数据表明该组件超出范围或未知。
  + `Corrected`— 使用参考数据更正了组件。
  + `Exact`— 组件已通过验证，未做任何更改。
  + `Alias`— 使用参考数据别名验证了组件。
  + `Appended`— 使用参考数据追加了组件。

#### 组件验证字段对
<a name="component-validation-fields-list"></a>

Output\_ \_组件\_地址\_国家/地区\_状态 ValidationResults  
国家/地区部分的验证状态。

输出\_ \_组件\_地址\_国家/地区\_ ValidationResults StatusDetail  
国家/地区部分的详细验证状态。

Output\_ \_组件\_地址\_区域\_状态 ValidationResults  
区域组件的验证状态。

输出\_ \_组件\_地址\_区域\_ ValidationResults StatusDetail  
区域组件的详细验证状态。

Output\_ \_组件\_地址\_本地\_状态 ValidationResults  
地点组件的验证状态。

输出\_ \_组件\_地址\_本地\_ ValidationResults StatusDetail  
地点组件的详细验证状态。

输出\_ \_组件\_地址\_街道\_状态 ValidationResults  
街道组件的验证状态。

输出\_ \_组件\_地址\_街道\_ ValidationResults StatusDetail  
街道组件的详细验证状态。

输出\_ \_组件\_地址\_ \_状态 ValidationResults AddressNumber  
地址号码组件的验证状态。

输出\_ \_组件\_地址\_ \_ ValidationResults AddressNumber StatusDetail  
地址号码组件的详细验证状态。

Output\_ \_组件\_地址\_ \_ ValidationResults Base\_Status PostalCodeDetails  
邮政编码基础组件的验证状态。

输出\_ \_组件\_地址\_ \_Base\_ ValidationResults PostalCodeDetails StatusDetail  
邮政编码基础组件的详细验证状态。

输出\_ \_组件\_地址\_ \_扩展\_状态 ValidationResults PostalCodeDetails  
邮政编码扩展组件的验证状态。

输出\_ \_组件\_地址\_ \_扩展\_ ValidationResults PostalCodeDetails StatusDetail  
邮政编码扩展组件的详细验证状态。

Output\_ \_组件\_地址\_ \_单位\_状态 ValidationResults SecondaryAddressComponents  
单位组件的验证状态。

输出\_ \_组件\_地址\_ \_单位\_ ValidationResults SecondaryAddressComponents StatusDetail  
单元组件的详细验证状态。

输出\_ \_组件\_地址\_ \_楼层\_状态 ValidationResults SecondaryAddressComponents  
底板组件的验证状态。

输出\_ \_组件\_地址\_ \_楼层\_ ValidationResults SecondaryAddressComponents StatusDetail  
地板组件的详细验证状态。

### 其他功能输出
<a name="additional-feature-output"></a>

如果您在启动作业时请求了其他功能，则输出包括：

#### 位置
<a name="position-output"></a>

世界大地测量系统 (WGS 84) 格式的地理坐标。

输出\_位置\_经度  
世界大地测量系统 (WGS 84) 格式的经度坐标。

输出\_位置\_纬度  
世界大地测量系统 (WGS 84) 格式的纬度坐标。

#### 特定国家/地区的属性
<a name="country-specific-attributes"></a>

特定国家的邮政和人口普查数据。可用字段因国家/地区而异。

##### 澳大利亚
<a name="australia-attributes"></a>

##### AustraliaPost
<a name="australia-post"></a>

输出\_ \_AUS\_ \_ CountrySpecificAttributes AustraliaPost DeliveryPointIdentifier  
澳大利亚邮政开发的八位数代码，可以对澳大利亚的每个配送点进行唯一标识。

##### 人口普查
<a name="australia-census"></a>

Output\_ \_ CountrySpecificAttributes aus\_Census\_ MeshBlockId  
网格区块是澳大利亚统计局定义的最小地理区域，构成了澳大利亚统计地理标准（ASGS）中较大区域的基石。它们广泛地确定了土地用途，例如住宅、商业、初级生产和公园。

##### Gnaf
<a name="australia-gnaf"></a>

Output\_ \_ CountrySpecificAttributes aus\_GNAF\_ AddressClass  
地址类，它是使用地址元素的组合构造的。值包括：`A`（别名）、`P`（主要）、（主要）、`PP`（主中学）、`PS`（主中学）、`AP`（别名主要）、`AS`（别名次要）。

Output\_ \_ CountrySpecificAttributes aus\_GNAF\_ GnafPid  
永久标识符是该记录所代表的现实世界特征所独有的。永久标识符 (PID) 是一个 14 个字符的字母数字字符串，用于唯一标识每个 G-NAF 地址。

Output\_ \_ CountrySpecificAttributes aus\_GNAF\_ LegalParcelId  
G-NAF 中的此字段旨在保存与特定地址关联的地块的唯一标识符。宗地 ID，表示平面图上的地块描述。由政府机构使用。格式各不相同。

Output\_ \_aus\_gnaf\_ 1 CountrySpecificAttributes StatisticalArea  
由整个网格块构建的地理区域。整体 SA1s 汇总形成统计区级别 2 (SA2s)。统计区域级别 1 (SA1) 字段，表示人口普查中使用的地理区域。七位数的唯一代码。

##### 加拿大
<a name="canada-attributes"></a>

##### CanadaPost
<a name="canada-post"></a>

输出\_ \_CAN\_ \_ CountrySpecificAttributes CanadaPost BuildingType  
表示建筑物是商务楼还是公寓楼的代码。有效值为：`1`= 住宅，`2`= 商业。

输出\_ \_CAN\_ \_ CountrySpecificAttributes CanadaPost RecordType  
定义 “地址查询” 和 “文本查找” 文件中的记录类型。值包括：`A1`（高层建筑）、`B1`（大容量接收器）、`C1`（政府地址）、`D2`（LVR由锁箱提供服务）、`E2`（由锁箱为政府提供服务）、`F2`（普通快递服务的LVR）、`11`（街道）、`21`（按路线服务的街道）、`32`（邮政信箱）。

##### 人口普查
<a name="canada-census"></a>

输出\_ \_can\_cen CountrySpecificAttributes sus\_ DisseminationArea  
唯一标识传播区域。它由两位数的省份或地区代码、两位数的人口普查分区代码和四位数的传播区号组成。

输出\_ \_can\_cen CountrySpecificAttributes sus\_Division  
唯一标识人口普查部门。的前两位数字 CDuid 用于标识省份或领地 (PR)。

输出\_ \_can\_cen CountrySpecificAttributes sus\_ MetropolitanArea  
由一个或多个以人口中心（称为核心）为中心的相邻城市组成。

输出\_ \_can\_cen CountrySpecificAttributes sus\_subdivision  
唯一标识该国的人口普查分区。省/地区、人口普查分区和人口普查分区（直辖市）代码组合起来代表标准地理分类 (SGC)。

输出\_ \_can\_cen CountrySpecificAttributes sus\_tract  
在代码中标识人口普查CMA/CA. To uniquely identify each census tract in its corresponding census metropolitan area or tracted census agglomeration, the three-digit CMA/CA区域，代码必须位于人口普查区域 “名称” 之前。

##### 美国
<a name="usa-attributes"></a>

##### USPS
<a name="usa-usps"></a>

Output\_ \_us CountrySpecificAttributes a\_usps\_ CarrierRoute  
邮政编码内的一组邮寄地址，USPS 将其组合在一起，以提高邮件投递过程的效率。就像邮政编码将国家划分为不同的区域一样，承运人的航线也将这些邮政编码划分。

Output\_ \_us CountrySpecificAttributes a\_usps\_ DefaultFlag  
表示处理的记录与 ZIP \+ 4 产品中的高层建筑、农村路线或街道默认记录相匹配。 `Y`-默认旗帜指示器已设置，`N`或空白-可接受。

Output\_ \_usa\_usps\_ \_ CountrySpecificAttributes Barcode DeliveryPoint  
房屋/箱子的 2 位数交货点。

Output\_ \_usa\_usps\_ \_ CountrySpecificAttributes DeliveryPoint CheckDigit  
一个数字，与 DPBC 中其他数字的总和相加，得出的数字是十的倍数。

Output\_ \_us CountrySpecificAttributes a\_usps\_elot\_ AscendingDescendingFlag  
该 ascending/descending 代码表示序列号内的近似交货顺序。

Output\_ \_us CountrySpecificAttributes a\_usps\_elot\_ SequenceNumber  
增强的旅行线路 (eLOT) 序列号，可帮助邮件员以与承运人的投递路径一致的方式对邮件进行分类。表示在承运人路线内首次向附加范围配送的货件。

Output\_ \_us CountrySpecificAttributes a\_usps\_ NonDeliverableRecord  
第一阶段文件中的字段表示地址测试问题与 ZIP \+ 4® 产品上的记录有效匹配。但是，匹配的是不可送达 (ND) 类型的记录。 `Y`-Record 是 ND 类型，空白-Record 不是 ND 类型。

Output\_ \_us CountrySpecificAttributes a\_usps\_ PoBoxOnlyFlag  
市州商品中有一部分包含仅限邮政信箱的配送区域。文件布局使用`P`与现有 ZIP 不同的版权详细信息代码。分类代码`P`位于城市州详细记录的第十三 (13) 位置，表示有邮政信箱和其他类型的配送到社区。这些区域没有其他形式的邮政投递。

Output\_ \_us CountrySpecificAttributes a\_usps\_ RecordType  
与输入地址匹配的地址记录的类型，例如 Firm () General Delivery (`F`) Highrise (`G`) P.O. Box (`H`) Rural Route (`P``R`) 或 Street Record (`S`)。

Output\_ \_us CountrySpecificAttributes a\_usps\_ RuralRouteDefault  
表示农村路线匹配。 `Y`-与农村路线记录匹配的地址。 `N`或空白-地址与农村路线记录不匹配。

产出\_ \_us CountrySpecificAttributes a\_usa\_USPS\_城市化  
波多黎各城市化名称。

Output\_ \_us CountrySpecificAttributes a\_usps\_ ZipValid  
表示有效邮政编码的 True/False 标志。表示是否可以将地址记录添加到 3553 表格中。五位数验证要求城市州和邮政编码的最后一行值相互对应。

Output\_ \_us CountrySpecificAttributes a\_usps\_zip10  
带有破折号分隔符的 10 位邮政编码 (ZIP \+ 4)。

Output\_ \_us CountrySpecificAttributes a\_usps\_zip9  
9 位数的邮政编码（邮政编码 \+ 4）。

##### 人口普查
<a name="usa-census"></a>

Output\_ \_us CountrySpecificAttributes a\_Census\_ BlockId  
2020 年人口普查区块编号。

输出\_ \_usa\_census\_ \_Number CountrySpecificAttributes CombinedStatisticalArea  
合并统计区 (CSA) 编号。

Output\_ \_usa\_census\_ \_Nam CountrySpecificAttributes e CombinedStatisticalArea  
组合统计区 (CSA) 名称。

输出\_ \_usa\_census\_ \_Number CountrySpecificAttributes CoreBasedStatisticalArea  
基于核心的统计区域 (CBSA) 编号。

Output\_ \_usa\_census\_ \_Nam CountrySpecificAttributes e CoreBasedStatisticalArea  
地址所在的基于核心的统计区 (CBSA) 的名称。

Output\_ \_us CountrySpecificAttributes a\_Census\_ CountyFipsCode  
县 FIPS 代码。

Output\_ \_us CountrySpecificAttributes a\_Census\_ MetropolitanAreaFlag  
表示地址所在的基于核心的统计区 (CBSA) 是大都市区还是小都市区 (`Y`/`N`)。

##### 英国
<a name="uk-attributes"></a>

##### RoyalMail
<a name="uk-royalmail"></a>

输出\_ \_GBR\_ \_ CountrySpecificAttributes RoyalMail SubBuilding  
地址的子建筑物名称 and/or 标识符。

输出\_ \_GBR\_ \_ CountrySpecificAttributes RoyalMail ThoroughfareName  
地址的街道或大道的基本名称。

输出\_ \_GBR\_ \_ CountrySpecificAttributes RoyalMail DependentThoroughfareName  
地址的双重依赖通道。当其他命名的通道内有命名的通道时，就会使用此方法。

输出\_ \_GBR\_ \_ CountrySpecificAttributes RoyalMail DependentLocality  
地址的依赖位置。当某个地方内存在名称相同或相似的大道时，就会使用此方法。

输出\_ \_GBR\_ \_ CountrySpecificAttributes RoyalMail DoubleDependentLocality  
地址的双重依赖位置。当一个依赖地区内有多条名称相同或相似的大道时，将使用此方法。

输出\_ \_GBR\_ \_ CountrySpecificAttributes RoyalMail OrganizationName  
在该地址注册的组织的名称。

Output\_ \_GBR\_ \_Udprn CountrySpecificAttributes RoyalMail  
唯一配送点参考号 (UDPRN) 是皇家邮政分配给英国境内地址的唯一的 8 位数代码。