重点领域 2：为可组合性和协作性而设计

Job to done：“让我像构建服务一样构建代理 — 模块化且可测试，这样它们就可以根据需要进行组合和编排。”

许多人工智能工作都是从单一的、以模型为中心的飞行员开始的。它们很有用，但很难跨领域扩展或适应复杂的问题。当这些药剂设计为互操作时，可以对化合物进行估值。在技术领域，可组合性是将模块化组件组合在一起以创建能够适应变化的灵活、可扩展的解决方案的行为。如果没有可组合性，智能就会被锁定在特定的工作流程中。此外，代理协作还会带来编排、状态管理和协议协商的复杂性，而传统的自动化团队可能无法处理这些问题。

Strategy

拥抱多代理模式。像组织部门这样的模型代理：模块化、专业化和可互操作。定义清晰的接口、共享的上下文格式和标准通信协议，例如模型上下文协议 (MCP) 或 Agent2Agent (A2A)。采用多代理编排模式，例如 swarm、graph 或分层协调。根据任务结构和信任级别，这些模式可以帮助代理以并行、顺序或共识驱动的工作流程动态发现能力并相互请求服务。

要促进可扩展且受管控的协作，请使用仲裁代理。这种代理是一个中立的机构，可以根据已知的能力和后备策略促进任务分配。虽然不是集中式控制器，但仲裁代理在信任和合规性方面起着至关重要的作用。它确保敏感或受监管的任务仅路由给符合身份和策略要求的代理。它充当受策略约束的工作流程的看门人。它强制隔离并支持可解释的委托。至关重要的是，仲裁代理不是瓶颈；它与以横向方式运作的自我协调代理共存。 peer-to-peer这些代理直接委派子任务、共享上下文和解析依赖关系。

这种混合模型既支持确定性分配（通过仲裁代理），也支持紧急协作。它将结构与灵活性融为一体。在此架构中，代理可以分为以下特殊角色：

决策代理人，例如政策执行者、资源分配者和风险评估者
知识代理，例如上下文聚合器、模式识别器和异常检测器
执行代理，例如任务执行者、质量控制员和集成经理

为了有效协调，多代理系统必须支持用于状态管理、故障恢复和冲突解决的强大交互协议。即使代理人独立运作，这也促进了稳定性和问责制。

制定明确的扩展规则，例如基于负载的代理实例化、上下文感知资源分配以及自动能力发现和注册。这些措施有助于系统根据需求或复杂性动态增长。

将代理设计为分布式消息传递基板中的 ready-to-use模块。例如，您可以将 A mazon EventBridge 与 A2A 或 MCP 配合使用，而不是孤立的服务。采用版本控制、 CI/CD 管道和代理模板来支持系统稳定性，同时加快内部采用和生命周期演进。鼓励代码重用和标准化，以减少集成摩擦并促进具有弹性的生态系统。

协作是一种力量倍增器。它可以在多代理环境中解锁规模、专业化和弹性。为了支持这种动态协作，组织应设计一个用于代理协调的轻量级控制平面。该控制平面包括以下内容：

功能注册表，定义每个代理可以做什么，并支持版本化元数据以供同行发现
任务仲裁逻辑，使用仲裁员或主管代理根据上下文、可用性和策略来路由任务
生命周期和状态跟踪，可实现实时决策上下文和安全交接

控制平面可确保多代理系统保持可扩展性、策略一致性和容错性，而不会集中权限或减慢运营速度。

但是，多代理环境也带来了操作难题。维护座席交互的背景信息、管理共享状态和协调操作会增加复杂性和成本。如果您在代理间通信期间使用消耗代币 LLMs 的代币，则成本可能会增加。必须将这些成本与大规模智能自动驾驶的复合业务收益进行权衡。

为了应对这些挑战，可以考虑将关键问题抽象出来的代理平台，例如：

标准化的通信协议和语义格式
内置编排逻辑和动态路由
代理之间共享上下文和内存管理
故障期间的回退处理和优雅降级

对于采用多代理策略的团队，最好的方法是从小处着手，然后进行规模化设计。从解决实际问题的有针对性的单一代理解决方案开始。然后，逐步将这些代理组合成一个合作系统，在这个系统中，每个人都可以根据共同的目标和全系统的背景进行发现、协调和委派。

重要的是，强大的错误处理和优雅的降级必须是主要的设计原则。当代理不可用或出现故障时，多代理系统应能够继续部分工作流程或启动备份逻辑。这无需刚性耦合即可提高可靠性。

AWS 服务提供强大的功能来大规模支持此架构。Amazon EventBridge 和 EventBridge P ipes 为多代理消息传递提供了结构化、事件驱动的支柱。为了管理模块化行为，AWS AppConfig允许在代理实例之间进行安全、动态的配置切换。要支持共享上下文和内存管理，请使用 Amazon Dynamo DB 实现轻量级、租户感知状态持久化以及跨代理的快速上下文检索。您可以使用亚马逊简单存储服务 (Amazon S3) S ervice 来存储结构化提示历史记录、共享项目或代理生成的输出。对于需要状态协调的更复杂的工作流程，AWS Step Functions可以使用检查点和错误恢复逻辑来协调长时间运行的流程。这些服务共同帮助您创建可组合、弹性且语义连接的多代理系统，这些系统可根据企业需求进行扩展。

多代理系统的商业价值

虽然许多组织从单代理解决方案开始其人工智能之旅，但代理人工智能的全部潜力是通过可扩展的多代理系统来释放的。这些系统是解决复杂的分布式问题和创建可随业务需求而演变的强大、灵活的人工智能生态系统的关键。

多代理系统的核心业务优势包括：

可扩展性 — 任务和工作负载可以分布在专门的代理上，以提高容量和性能。
灵活性-可以在最小的干扰下添加、替换或修改代理，从而在动态环境中实现灵活性。
弹性 — 借助冗余角色和智能故障转移，即使单个代理出现故障，也能保持系统稳定性。
专业化 — 专门构建的代理以更高的效率和精确度执行任务。
成本效益 — 可重复使用的代理组件可加快开发速度并降低新功能部署的成本。

虽然多代理系统需要更多的前期规划，但它们可以提供长期的敏捷性、速度和创新能力。投资于灵活的代理协作架构的企业有能力快速部署新的 AI 功能，适应不断变化的需求，并在日益由代理驱动的竞争格局中处于领先地位。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

意图和范围

多租户和控制