View a markdown version of this page

地址验证 - Amazon Location Service

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

地址验证

地址验证作业处理地址数据以验证和标准化地址。该服务支持自由格式的地址行和结构化地址组件,并且可以选择使用地理坐标和特定国家/地区的邮政属性来增强结果。

地址验证支持来自以下国家/地区的地址:澳大利亚、加拿大、英国和美国。

地址验证功能

地址验证提供以下用于验证和增强地址数据的功能:

地址标准化

地址验证通过对照权威地址数据集检查地址来验证地址是否存在并且可以送达。地址标准化格式根据官方邮政标准(例如一致的缩写、大小写和标点符号)来格式化地址。它还可以纠正诸如拼写错误之类的错误,并添加缺失的地址组成部分,例如邮政编码和街道名称。

增强验证

地址验证作业支持可选的附加功能,这些功能可以增强验证结果:

  • 位置-返回已验证地址的地理坐标(经度和纬度),使您能够绘制地址地图或执行地理分析。此功能仅在美国、加拿大和澳大利亚提供,并且会产生额外费用。

  • CountrySpecificAttributes— 提供特定于每个国家的邮政系统信息。例如,美国地址接收 USPS 数据,例如送货点代码和承运人路线信息,而澳大利亚地址则接收澳大利亚邮政标识符。

有关定价的更多信息,请参阅职位定价

地址验证用例

医疗保健系统和保险公司

验证患者和提供者的地址,以满足索赔处理、护理协调和监管报告要求。

金融服务和保险公司

标准化客户地址,以支持身份验证工作流程、风险评估和欺诈防范。

零售和电子商务运营

清理客户数据库以减少配送失败、提高配送率并优化配送成本。

运输和物流提供商

验证配送地址以优化路线,减少最后一英里运营中失败的配送。

数据迁移和数据库维护

在系统转换期间执行一次性数据库清理,并定期验证地址记录以保持数据质量。

分析、报告和实体解析

通过实体解析工作流程,实现基于位置的分析、人口统计分析和客户关系管理 (CRM) 数据库清理的标准化地址。

输入架构

地址验证作业需要具有特定架构的输入数据。该架构支持自由格式的地址行和结构化地址组件,允许您以最符合您的数据的格式提交地址。

输入架构包括以下字段:

Id

为该输入记录提供的可选标识符。如果提供,则会在输出文件中进行镜像,Input_Id以帮助您将输出记录与其对应的输入关联起来。

地址行

使用 th AddressLines_1 rou AddressLines_5 gh 获取自由格式的地址。在中输入单行输入。AddressLines_1根据地区邮政规则订购多行输入,就像它们在邮件中显示的那样。

AddressComponents_国家

地址所在国家/地区的 alpha-2、alpha-3 字符代码或全名。

AddressComponents_区域

输入地址的区域,例如州、省或领地。

AddressComponents_SubRegion

输入地址的子区域,例如县。

AddressComponents_Locality

输入地址的地点,例如城市或城镇。

AddressComponents_PostalCode

输入地址的邮政编码。

AddressComponents_Street

输入地址的街道名称。

AddressComponents_AddressNumber

输入地址的地址或门牌号。

AddressComponents_Unit

输入地址的单位。

AddressComponents_UnitDesignator

输入地址的单位标识符或类型,例如 Apt、Suite 或 #。

注意

在请求 AddressComponents 中同时使用 AddressLines 和时,请在中输入第一行地址组成部分(AddressNumber、街道、单位和 UnitDesignator)。 AddressLines输入最后一行组件(地点、地区、 SubRegion、国家/地区和 PostalCode) AddressComponents

以下 Python 脚本创建了一个包含地址数据的示例 Parquet 文件:

import pyarrow as pa import pyarrow.parquet as pq data = [ { "Id": "record-001", "AddressLines_1": "Pike Place", "AddressLines_2": "Apartment 4B", "AddressLines_3": None, "AddressLines_4": None, "AddressLines_5": None, "AddressComponents_Country": "USA", "AddressComponents_Region": None, "AddressComponents_SubRegion": None, "AddressComponents_Locality": None, "AddressComponents_PostalCode": "98101", "AddressComponents_Street": None, "AddressComponents_AddressNumber": None, "AddressComponents_Unit": None, "AddressComponents_UnitDesignator": None }, { "Id": "record-002", "AddressLines_1": "2901 E Madison St", "AddressLines_2": None, "AddressLines_3": None, "AddressLines_4": None, "AddressLines_5": None, "AddressComponents_Country": "USA", "AddressComponents_Region": None, "AddressComponents_SubRegion": None, "AddressComponents_Locality": None, "AddressComponents_PostalCode": "98112", "AddressComponents_Street": None, "AddressComponents_AddressNumber": None, "AddressComponents_Unit": None, "AddressComponents_UnitDesignator": None } ] schema = pa.schema([ ("Id", pa.string()), ("AddressLines_1", pa.string()), ("AddressLines_2", pa.string()), ("AddressLines_3", pa.string()), ("AddressLines_4", pa.string()), ("AddressLines_5", pa.string()), ("AddressComponents_Country", pa.string()), ("AddressComponents_Region", pa.string()), ("AddressComponents_SubRegion", pa.string()), ("AddressComponents_Locality", pa.string()), ("AddressComponents_PostalCode", pa.string()), ("AddressComponents_Street", pa.string()), ("AddressComponents_AddressNumber", pa.string()), ("AddressComponents_Unit", pa.string()), ("AddressComponents_UnitDesignator", pa.string()) ]) table = pa.Table.from_pylist(data, schema=schema) pq.write_table(table, 'addresses.parquet')

有关文件大小限制,请参阅准备输入数据

输出架构

地址验证作业生成的输出包括标准化地址组件、验证结果和可选的其他要素数据。以下各节描述了特定于地址验证的输出字段。

有关输出架构的一般信息以及如何检索结果,请参阅检索工作结果

输出地址字段

带有Output_前缀的标准化地址组件,根据地区邮政规则进行格式化。

输出_ AddressId

返回地址的唯一标识符。

输出_ _1 AddressLines

完整返回地址的第一行用多行写成,因为它应该出现在邮件中。它是根据地区邮政规则进行格式化的。

输出_ _2 AddressLines

完整返回地址的第二行用多行写成,因为它应该出现在邮件中。它是根据地区邮政规则进行格式化的。

输出_ _3 AddressLines

完整返回地址的第三行用多行写成,因为它应该出现在邮件中。它是根据地区邮政规则进行格式化的。

输出_ _4 AddressLines

完整返回地址的第四行写在多行上,因为它应该出现在邮件中。它是根据地区邮政规则进行格式化的。

输出_ _5 AddressLines

完整返回地址的第五行用多行写成,因为它应该出现在邮件中。它是根据地区邮政规则进行格式化的。

输出地址_标签

根据地区邮政规则,组装的地址由地址组成部分构成。

输出地址_国家/地区_代码2

该国家/地区的 Alpha-2 字符代码。

输出地址_国家/地区_代码3

该国家/地区的 Alpha-3 字符代码。

输出地址_国家/地区_名称

国家的全名。

输出地址_区域_代码

该地区的缩写代码。

输出地址_区域_名称

该地区的全名。

输出_地址_ _代码 SubRegion

子区域的缩写代码。

输出_地址_ _名称 SubRegion

子区域的全名。

输出_地址_地点

地址的位置部分,例如城市或城镇。

输出地址_ PostalCode

地址的完整邮政编码部分。

输出_地址_ _ PostalCodeDetails Base

邮政编码的基段。

输出_地址_ _扩展名 PostalCodeDetails

邮政编码的分机段或附加段。

输出_地址_街道

地址的完整街道部分。

输出_地址_ _ StreetComponents BaseName

基本名称是街道名称的一部分。

输出_地址_ _Pref StreetComponents ix

位于道路基本名称之前但不包含在道路基本名称中的方向标识符。

输出_地址_ _Suff StreetComponents ix

跟随道路基本名称但不包含在道路基本名称中的方向标识符。

输出_地址_ _类型 StreetComponents

街道类型街道名称的一部分ST,例如、AVEBLVD

输出_地址_ _ StreetComponents TypePlacement

定义街道类型是在基本名称之前还是之后。 (BeforeBaseNameAfterBaseName

输出地址_ AddressNumber

地址中的地址或门牌号部分。

输出_地址_ _单位_编号 SecondaryAddressComponents

单位辅助地址组件的字母数字标识符。

输出_地址_ _单位标识符 SecondaryAddressComponents

单位辅助地址组件的标号,如地址标签中显示的那样。

输出_地址_ _楼层_号码 SecondaryAddressComponents

楼层辅助地址组件的字母数字标识符。

输出_地址_ _楼层_标识符 SecondaryAddressComponents

楼层辅助地址组件的标号,显示在地址标签中。

地址元数据

有关地址和配送特征的元数据。

Output_ _ _Mailable AddressMetadata DeliveryIndicators

表示地址是否可邮寄。值:true/false

输出_ _ _ AddressMetadata 可定位 DeliveryIndicators

表示地址是否可定位。值:true/false

验证结果

地址的总体验证质量指标。

输出_ _ ValidationResults ValidationGranularity

表示验证返回地址的总体粒度级别。值:

  • Premise— 地址号码级别的所有组件都经过验证

  • Street— 街道上的所有组件都经过了验证

  • LocalityAndPostalCode— 验证了地点 PostalCode、和国家

  • Locality— 验证了地点和国家

输出_ _ ValidationResults MatchConfidence

表示地址验证过程中执行的地址匹配的总体可信度。值:HighMediumHighMediumMediumLowLow

输出_ _ ValidationResults MatchConfidenceScore

为比赛信心提供精确的分数。范围为 0-1.0,其中 1.0 表示完美匹配。

组件验证状态

对于每个地址组成部分,有两个字段表示验证结果:

  • Status字段表示验证状态:ValidatedUnconfirmed

  • StatusDetail字段提供了有关验证状态的更多详细信息:

    • NotFound— 未找到组件或组件为空。

    • StandardizedNoMatch— 组件已被解析和标准化,但未在参考数据中识别。

    • OutOfRange— 未识别组件,参考数据表明该组件超出范围或未知。

    • Corrected— 使用参考数据更正了组件。

    • Exact— 组件已通过验证,未做任何更改。

    • Alias— 使用参考数据别名验证了组件。

    • Appended— 使用参考数据追加了组件。

Output_ _组件_地址_国家/地区_状态 ValidationResults

国家/地区部分的验证状态。

输出_ _组件_地址_国家/地区_ ValidationResults StatusDetail

国家/地区部分的详细验证状态。

Output_ _组件_地址_区域_状态 ValidationResults

区域组件的验证状态。

输出_ _组件_地址_区域_ ValidationResults StatusDetail

区域组件的详细验证状态。

Output_ _组件_地址_本地_状态 ValidationResults

地点组件的验证状态。

输出_ _组件_地址_本地_ ValidationResults StatusDetail

地点组件的详细验证状态。

输出_ _组件_地址_街道_状态 ValidationResults

街道组件的验证状态。

输出_ _组件_地址_街道_ ValidationResults StatusDetail

街道组件的详细验证状态。

输出_ _组件_地址_ _状态 ValidationResults AddressNumber

地址号码组件的验证状态。

输出_ _组件_地址_ _ ValidationResults AddressNumber StatusDetail

地址号码组件的详细验证状态。

Output_ _组件_地址_ _ ValidationResults Base_Status PostalCodeDetails

邮政编码基础组件的验证状态。

输出_ _组件_地址_ _Base_ ValidationResults PostalCodeDetails StatusDetail

邮政编码基础组件的详细验证状态。

输出_ _组件_地址_ _扩展_状态 ValidationResults PostalCodeDetails

邮政编码扩展组件的验证状态。

输出_ _组件_地址_ _扩展_ ValidationResults PostalCodeDetails StatusDetail

邮政编码扩展组件的详细验证状态。

Output_ _组件_地址_ _单位_状态 ValidationResults SecondaryAddressComponents

单位组件的验证状态。

输出_ _组件_地址_ _单位_ ValidationResults SecondaryAddressComponents StatusDetail

单元组件的详细验证状态。

输出_ _组件_地址_ _楼层_状态 ValidationResults SecondaryAddressComponents

底板组件的验证状态。

输出_ _组件_地址_ _楼层_ ValidationResults SecondaryAddressComponents StatusDetail

地板组件的详细验证状态。

其他功能输出

如果您在启动作业时请求了其他功能,则输出包括:

位置

世界大地测量系统 (WGS 84) 格式的地理坐标。

输出_位置_经度

世界大地测量系统 (WGS 84) 格式的经度坐标。

输出_位置_纬度

世界大地测量系统 (WGS 84) 格式的纬度坐标。

特定国家/地区的属性

特定国家的邮政和人口普查数据。可用字段因国家/地区而异。

AustraliaPost
输出_ _AUS_ _ CountrySpecificAttributes AustraliaPost DeliveryPointIdentifier

澳大利亚邮政开发的八位数代码,可以对澳大利亚的每个配送点进行唯一标识。

人口普查
Output_ _ CountrySpecificAttributes aus_Census_ MeshBlockId

网格区块是澳大利亚统计局定义的最小地理区域,构成了澳大利亚统计地理标准(ASGS)中较大区域的基石。它们广泛地确定了土地用途,例如住宅、商业、初级生产和公园。

Gnaf
Output_ _ CountrySpecificAttributes aus_GNAF_ AddressClass

地址类,它是使用地址元素的组合构造的。值包括:A(别名)、P(主要)、(主要)、PP(主中学)、PS(主中学)、AP(别名主要)、AS(别名次要)。

Output_ _ CountrySpecificAttributes aus_GNAF_ GnafPid

永久标识符是该记录所代表的现实世界特征所独有的。永久标识符 (PID) 是一个 14 个字符的字母数字字符串,用于唯一标识每个 G-NAF 地址。

Output_ _ CountrySpecificAttributes aus_GNAF_ LegalParcelId

G-NAF 中的此字段旨在保存与特定地址关联的地块的唯一标识符。宗地 ID,表示平面图上的地块描述。由政府机构使用。格式各不相同。

Output_ _aus_gnaf_ 1 CountrySpecificAttributes StatisticalArea

由整个网格块构建的地理区域。整体 SA1s 汇总形成统计区级别 2 (SA2s)。统计区域级别 1 (SA1) 字段,表示人口普查中使用的地理区域。七位数的唯一代码。

CanadaPost
输出_ _CAN_ _ CountrySpecificAttributes CanadaPost BuildingType

表示建筑物是商务楼还是公寓楼的代码。有效值为:1= 住宅,2= 商业。

输出_ _CAN_ _ CountrySpecificAttributes CanadaPost RecordType

定义 “地址查询” 和 “文本查找” 文件中的记录类型。值包括:A1(高层建筑)、B1(大容量接收器)、C1(政府地址)、D2(LVR由锁箱提供服务)、E2(由锁箱为政府提供服务)、F2(普通快递服务的LVR)、11(街道)、21(按路线服务的街道)、32(邮政信箱)。

人口普查
输出_ _can_cen CountrySpecificAttributes sus_ DisseminationArea

唯一标识传播区域。它由两位数的省份或地区代码、两位数的人口普查分区代码和四位数的传播区号组成。

输出_ _can_cen CountrySpecificAttributes sus_Division

唯一标识人口普查部门。的前两位数字 CDuid 用于标识省份或领地 (PR)。

输出_ _can_cen CountrySpecificAttributes sus_ MetropolitanArea

由一个或多个以人口中心(称为核心)为中心的相邻城市组成。

输出_ _can_cen CountrySpecificAttributes sus_subdivision

唯一标识该国的人口普查分区。省/地区、人口普查分区和人口普查分区(直辖市)代码组合起来代表标准地理分类 (SGC)。

输出_ _can_cen CountrySpecificAttributes sus_tract

在代码中标识人口普查CMA/CA. To uniquely identify each census tract in its corresponding census metropolitan area or tracted census agglomeration, the three-digit CMA/CA区域,代码必须位于人口普查区域 “名称” 之前。

USPS
Output_ _us CountrySpecificAttributes a_usps_ CarrierRoute

邮政编码内的一组邮寄地址,USPS 将其组合在一起,以提高邮件投递过程的效率。就像邮政编码将国家划分为不同的区域一样,承运人的航线也将这些邮政编码划分。

Output_ _us CountrySpecificAttributes a_usps_ DefaultFlag

表示处理的记录与 ZIP + 4 产品中的高层建筑、农村路线或街道默认记录相匹配。 Y-默认旗帜指示器已设置,N或空白-可接受。

Output_ _usa_usps_ _ CountrySpecificAttributes Barcode DeliveryPoint

房屋/箱子的 2 位数交货点。

Output_ _usa_usps_ _ CountrySpecificAttributes DeliveryPoint CheckDigit

一个数字,与 DPBC 中其他数字的总和相加,得出的数字是十的倍数。

Output_ _us CountrySpecificAttributes a_usps_elot_ AscendingDescendingFlag

该 ascending/descending 代码表示序列号内的近似交货顺序。

Output_ _us CountrySpecificAttributes a_usps_elot_ SequenceNumber

增强的旅行线路 (eLOT) 序列号,可帮助邮件员以与承运人的投递路径一致的方式对邮件进行分类。表示在承运人路线内首次向附加范围配送的货件。

Output_ _us CountrySpecificAttributes a_usps_ NonDeliverableRecord

第一阶段文件中的字段表示地址测试问题与 ZIP + 4® 产品上的记录有效匹配。但是,匹配的是不可送达 (ND) 类型的记录。 Y-Record 是 ND 类型,空白-Record 不是 ND 类型。

Output_ _us CountrySpecificAttributes a_usps_ PoBoxOnlyFlag

市州商品中有一部分包含仅限邮政信箱的配送区域。文件布局使用P与现有 ZIP 不同的版权详细信息代码。分类代码P位于城市州详细记录的第十三 (13) 位置,表示有邮政信箱和其他类型的配送到社区。这些区域没有其他形式的邮政投递。

Output_ _us CountrySpecificAttributes a_usps_ RecordType

与输入地址匹配的地址记录的类型,例如 Firm () General Delivery (F) Highrise (G) P.O. Box (H) Rural Route (PR) 或 Street Record (S)。

Output_ _us CountrySpecificAttributes a_usps_ RuralRouteDefault

表示农村路线匹配。 Y-与农村路线记录匹配的地址。 N或空白-地址与农村路线记录不匹配。

产出_ _us CountrySpecificAttributes a_usa_USPS_城市化

波多黎各城市化名称。

Output_ _us CountrySpecificAttributes a_usps_ ZipValid

表示有效邮政编码的 True/False 标志。表示是否可以将地址记录添加到 3553 表格中。五位数验证要求城市州和邮政编码的最后一行值相互对应。

Output_ _us CountrySpecificAttributes a_usps_zip10

带有破折号分隔符的 10 位邮政编码 (ZIP + 4)。

Output_ _us CountrySpecificAttributes a_usps_zip9

9 位数的邮政编码(邮政编码 + 4)。

人口普查
Output_ _us CountrySpecificAttributes a_Census_ BlockId

2020 年人口普查区块编号。

输出_ _usa_census_ _Number CountrySpecificAttributes CombinedStatisticalArea

合并统计区 (CSA) 编号。

Output_ _usa_census_ _Nam CountrySpecificAttributes e CombinedStatisticalArea

组合统计区 (CSA) 名称。

输出_ _usa_census_ _Number CountrySpecificAttributes CoreBasedStatisticalArea

基于核心的统计区域 (CBSA) 编号。

Output_ _usa_census_ _Nam CountrySpecificAttributes e CoreBasedStatisticalArea

地址所在的基于核心的统计区 (CBSA) 的名称。

Output_ _us CountrySpecificAttributes a_Census_ CountyFipsCode

县 FIPS 代码。

Output_ _us CountrySpecificAttributes a_Census_ MetropolitanAreaFlag

表示地址所在的基于核心的统计区 (CBSA) 是大都市区还是小都市区 (Y/N)。

RoyalMail
输出_ _GBR_ _ CountrySpecificAttributes RoyalMail SubBuilding

地址的子建筑物名称 and/or 标识符。

输出_ _GBR_ _ CountrySpecificAttributes RoyalMail ThoroughfareName

地址的街道或大道的基本名称。

输出_ _GBR_ _ CountrySpecificAttributes RoyalMail DependentThoroughfareName

地址的双重依赖通道。当其他命名的通道内有命名的通道时,就会使用此方法。

输出_ _GBR_ _ CountrySpecificAttributes RoyalMail DependentLocality

地址的依赖位置。当某个地方内存在名称相同或相似的大道时,就会使用此方法。

输出_ _GBR_ _ CountrySpecificAttributes RoyalMail DoubleDependentLocality

地址的双重依赖位置。当一个依赖地区内有多条名称相同或相似的大道时,将使用此方法。

输出_ _GBR_ _ CountrySpecificAttributes RoyalMail OrganizationName

在该地址注册的组织的名称。

Output_ _GBR_ _Udprn CountrySpecificAttributes RoyalMail

唯一配送点参考号 (UDPRN) 是皇家邮政分配给英国境内地址的唯一的 8 位数代码。