Amazon Nova 2 中的新增功能

Amazon Nova 2 在语义理解、内容创作及语音能力方面实现了大幅升级。以下章节将介绍主要新增功能与改进项。

新模型

Nova 2 Lite: 增强型模型：具备高级推理能力，支持扩展思考，提供三级强度调控，并针对生产级智能代理工作流优化了多模态理解能力。
Nova 2 Sonic: 升级式对话语音模型：优化了七国语言的语音理解、自然语言处理与语音合成能力。
Nova Multimodal Embeddings: 多模态嵌入模型：支持文本、图像、文档、视频及音频输入，并生成对应嵌入向量。

全新特性与功能

Nova Multimodal Embeddings

Nova Multimodal Embeddings 通过单一模型支持文本、文档、图像、视频和音频，可实现跨模态检索应用程序。Nova Multimodal Embeddings 将各类内容映射到统一语义空间，支持执行单模态、跨模态及多模态向量运算，为代理检索增强生成（RAG）、多模态语义搜索等应用提供支撑。

扩展思考与推理

Nova 2 Lite 支持扩展思考，可让模型在生成回答前投入更多时间对复杂问题进行推理。该能力可提升多步推理任务的准确性，例如涉及多工具调用的代理工作流、高等数学运算、复杂规划及代码生成等场景。

要了解更多信息，请参阅 Amazon Nova 2 中的扩展思考。

内置工具

Amazon Nova 2 内置多款工具，无需外部集成即可扩展模型能力：

Web Grounding：获取网络实时信息，提供最新应答并减少幻觉输出。
代码解释器：执行 Python 代码完成运算。

构建人工智能代理

Amazon Nova 2 模型针对构建人工智能代理进行了优化。这些模型改进了工具的使用，增强了多步骤任务的推理能力，提升了在复杂代理工作流中保留上下文的能力。

改进文件理解

Nova 2 Lite 提供了增强的文档处理功能，可更好地理解复杂的文档布局、表格、图表和多页文档。此类模型可以更准确地从 PDF、电子表格和其他文档格式中提取信息。

增强视频理解

Nova 2 Lite 改进了视频分析功能，包括更好的视觉感知、时间理解、动作识别，以及能够以更高的准确性处理更长的视频序列。

模型自定义

Nova 2 Lite 支持在 Amazon Bedrock 和 SageMaker AI 上进行监督式微调（SFT）与强化微调（RFT），可让您根据自身特定业务需求定制 Amazon Nova 2。

Amazon Nova Forge

Amazon Nova Forge 是一项首创服务，让组织能够以最简单、最具成本效益的方式使用 Amazon Nova 构建自己的前沿模型。

后续步骤

若要了解 Amazon Nova 模型和功能，请参阅什么是 Amazon Nova 2？。
若要开始使用 Amazon Nova 2.0，请参阅开始使用 Amazon Nova 2。
若要探索核心推理功能，请参阅核心推理。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

什么是 Amazon Nova 2？

开始使用