Amazon Nova 2 中的新增功能
Amazon Nova 2 在语义理解、内容创作及语音能力方面实现了大幅升级。以下章节将介绍主要新增功能与改进项。
新模型
- Nova 2 Lite
-
增强型模型:具备高级推理能力,支持扩展思考,提供三级强度调控,并针对生产级智能代理工作流优化了多模态理解能力。
- Nova 2 Sonic
-
升级式对话语音模型:优化了七国语言的语音理解、自然语言处理与语音合成能力。
- Nova Multimodal Embeddings
-
多模态嵌入模型:支持文本、图像、文档、视频及音频输入,并生成对应嵌入向量。
全新特性与功能
Nova Multimodal Embeddings
Nova Multimodal Embeddings 通过单一模型支持文本、文档、图像、视频和音频,可实现跨模态检索应用程序。Nova Multimodal Embeddings 将各类内容映射到统一语义空间,支持执行单模态、跨模态及多模态向量运算,为代理检索增强生成(RAG)、多模态语义搜索等应用提供支撑。
扩展思考与推理
Nova 2 Lite 支持扩展思考,可让模型在生成回答前投入更多时间对复杂问题进行推理。该能力可提升多步推理任务的准确性,例如涉及多工具调用的代理工作流、高等数学运算、复杂规划及代码生成等场景。
要了解更多信息,请参阅 Amazon Nova 2 中的扩展思考。
内置工具
Amazon Nova 2 内置多款工具,无需外部集成即可扩展模型能力:
-
Web Grounding:获取网络实时信息,提供最新应答并减少幻觉输出。
-
代码解释器:执行 Python 代码完成运算。
构建人工智能代理
Amazon Nova 2 模型针对构建人工智能代理进行了优化。这些模型改进了工具的使用,增强了多步骤任务的推理能力,提升了在复杂代理工作流中保留上下文的能力。
改进文件理解
Nova 2 Lite 提供了增强的文档处理功能,可更好地理解复杂的文档布局、表格、图表和多页文档。此类模型可以更准确地从 PDF、电子表格和其他文档格式中提取信息。
增强视频理解
Nova 2 Lite 改进了视频分析功能,包括更好的视觉感知、时间理解、动作识别,以及能够以更高的准确性处理更长的视频序列。
模型自定义
Nova 2 Lite 支持在 Amazon Bedrock 和 SageMaker AI 上进行监督式微调(SFT)与强化微调(RFT),可让您根据自身特定业务需求定制 Amazon Nova 2。
Amazon Nova Forge
Amazon Nova Forge 是一项首创服务,让组织能够以最简单、最具成本效益的方式使用 Amazon Nova 构建自己的前沿模型。
后续步骤
-
若要了解 Amazon Nova 模型和功能,请参阅什么是 Amazon Nova 2?。
-
若要开始使用 Amazon Nova 2.0,请参阅开始使用 Amazon Nova 2。
-
若要探索核心推理功能,请参阅核心推理。