

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 启动数据收集
<a name="initiating-data-collection"></a>

数据收集是从应用程序和基础设施收集元数据的过程。该过程在评估的所有阶段都是反复进行的。在每个阶段，数据数量和保真度都会增加。在这一阶段，重点是收集有助于建立初始库存的一般数据。该清单将用于创建有针对性的商业案例，并确定初始迁移候选人。

确定当前数据源后，我们建议从尽可能多的系统中收集信息。有关更多信息，请参阅此阶段[的数据要求](understanding-initial-assessment-data-requirements.md)。

这种方法的好处是可以帮助更新当前的产品组合视图以及组织对其应用程序和服务的了解。它还有助于确定要移动的目标。推荐的方法是审查现有数据，例如配置管理数据库 (CMDB) 输出和信息技术服务管理 (ITSM) 系统。然后构建一份针对数据收集的资产列表。如果您的组织完全清楚迁移范围之内和范围之外的内容，则可以将数据收集限制在范围内的系统上。

在构建产品组合时，请考虑应用程序及其环境或软件发布生命周期。例如，与其识别客户关系管理 (CRM) 应用程序并指定其具有测试、开发和生产环境，不如列出三个应用程序（例如，CRM-Test、CRM-dev、CRM-Prod）。或者，使用 CRM 名称，但为每个环境分配一个唯一的 ID，并将它们作为单独的记录显示在数据存储库中。这将有助于单独规划和跟踪这些环境的迁移。例如，您可能想先迁移非生产环境。通过根据环境列出应用程序的实例，您可以清楚地管理和控制它们的过渡。

在数据收集过程中，可能不确定哪些应用程序或服务器位于给定的数据中心或源位置。在这些情况下，从现有管理工具中获取裸机和虚拟机管理程序列表会很有帮助。例如，您可以连接到虚拟机管理程序以获取要作为数据收集目标的虚拟机列表。

请注意，合并现有数据源时，初始输出可能不完整。关键是要根据这一阶段[的数据要求](understanding-initial-assessment-data-requirements.md)以及可以从现有来源获得的数据进行差距分析。将完整性百分比与数据保真度进行对比非常重要。来自低保真来源的更高的完整性级别将包含一些可能导致分析存在缺陷的假设。虽然此评估阶段不需要最高的数据保真度，但我们建议数据源至少为中高保真度。将这些数字与贵组织的风险承受能力进行对比，包括使用假设来填补数据空白。

差距分析可帮助您了解正在处理的数据的数量和质量。该分析还可以帮助您确定必须做出的假设级别，以创建有方向性的业务案例并确定要迁移的应用程序的优先顺序。发现工具可以帮助填补空白并收集高保真数据。为了提高数据的可信度并加快迁移结果，我们建议尽早部署发现工具。尽早采取行动也很重要，因为新工具的内部采购、安全和实施流程可能需要几周或几个月的时间才能完成。

我们建议在此阶段制定沟通计划或节奏以及范围变更控制机制。这可以帮助您随时向利益相关者通报情况，以便他们可以提前计划并降低风险。清晰沟通的一个关键要素是为应用程序组合和相关基础设施定义单一事实来源。避免保留多个记录系统以及应用程序和基础架构列表。将数据保存在支持版本控制和在线协作的地方（例如，数据库、工具或电子表格），并为其分配所有者。