

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 亚马逊 SageMaker JumpStart 行业：金融
<a name="studio-jumpstart-industry"></a>

使用 “ SageMaker JumpStart 行业：金融解决方案”、模型和示例笔记本，通过精心策划的一步式解决方案和以行业为重点的机器学习 (ML) 问题的示例笔记本来了解 SageMaker AI 的特性和功能。笔记本还介绍了如何使用 SageMaker JumpStart 行业 Python SDK 来增强行业文本数据和微调预训练模型。

**Topics**
+ [亚马逊 SageMaker JumpStart 行业 Python SDK](#studio-jumpstart-industry-pysdk)
+ [亚马逊 SageMaker JumpStart 行业：财务解决方案](#studio-jumpstart-industry-solutions)
+ [亚马逊 SageMaker JumpStart 行业：财务模型](#studio-jumpstart-industry-models)
+ [Amazon SageMaker JumpStart 行业：财务示例笔记本](#studio-jumpstart-industry-examples)
+ [亚马逊 SageMaker JumpStart 行业：金融博客文章](#studio-jumpstart-industry-blogs)
+ [亚马逊 SageMaker JumpStart 行业：金融相关研究](#studio-jumpstart-industry-research)
+ [亚马逊 SageMaker JumpStart 行业：其他财务资源](#studio-jumpstart-industry-resources)

## 亚马逊 SageMaker JumpStart 行业 Python SDK
<a name="studio-jumpstart-industry-pysdk"></a>

SageMaker Runtime 通过其名为 Industry SageMaker JumpStart Python SDK 的客户端库 JumpStart 提供了用于整理行业数据集和微调预训练模型的处理工具。如需详细了解 SDK 的 API 文档，以及有关处理和增强行业文本数据集以提高 state-of-the-art模型性能的更多信息 SageMaker JumpStart，请参阅 Industry [Python SDK 开源文档](https://sagemaker-jumpstart-industry-pack.readthedocs.io)。SageMaker JumpStart

## 亚马逊 SageMaker JumpStart 行业：财务解决方案
<a name="studio-jumpstart-industry-solutions"></a>

SageMaker JumpStart 行业：Financial 提供以下解决方案笔记本：
+ **企业信用评级预测**

本 SageMaker JumpStart 行业：金融解决方案为文本增强型企业信用评级模型提供了模板。它展示了如何根据数字特征（在本例中为 Altman 著名的 5 个财务比率）与 SEC 申报文件中的文本相结合的模型，来改善信用评级的预测。除了 5 个 Altman 比率之外，您还可以根据需要添加更多变量或设置自定义变量。本解决方案笔记本展示了 Industr SageMaker JumpStart y Python SDK 如何帮助处理美国证券交易委员会文件中文本的自然语言处理 (NLP) 评分。此外，该解决方案还演示了如何使用增强的数据集训练模型以实现 best-in-class模型，将模型部署到 SageMaker 人工智能端点进行生产，以及如何实时接收改进的预测。
+ **基于图形的信用评分**

传统上，信用评级是通过使用财务报表数据和市场数据的模型生成的，这些数据仅为表格数据（数字和类别）。该解决方案使用 [SEC 申报文件](https://www.sec.gov/edgar/searchedgar/companysearch.html)构建了一个公司网络，并展示了如何通过表格数据使用公司关系网络来生成准确的评级预测。该解决方案演示了一种方法，使用公司关联数据，将基于表格的传统信用评分模型（已在评级行业中使用了数十年），扩展到网络上的机器学习模型类别。

**注意**  
解决方案笔记本仅用于演示目的。不应将其作为财务或投资建议。

您可以通过 Studio Classic 中的 SageMaker JumpStart 页面找到这些金融服务解决方案。

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

**注意**  
 SageMaker JumpStart 行业：财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录 [SageMaker AI 控制台](https://console.aws.amazon.com/sagemaker)，然后启动 SageMaker Studio Classic。有关如何查找解决方案卡片的更多信息，请参阅上一个主题[SageMaker JumpStart](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html)。

## 亚马逊 SageMaker JumpStart 行业：财务模型
<a name="studio-jumpstart-industry-models"></a>

SageMaker JumpStart 行业：Financial 提供了以下经过预训练的[稳健优化的 BERT 方法 (RoBERTa) 模型](https://arxiv.org/pdf/1907.11692.pdf)：
+ **财务文本嵌入（Ro BERTa-sec-base）**
+ **RoBERTa-SEC-WIKI-Base **
+ **RoBERTa-SEC-Large **
+ **RoBERTa-SEC-WIKI-Large **

 RoBERTa-SEC-Base和 RoBERTa-SEC-Large模型是基于 [GluonNLP的Ro模型的文本嵌入BERTa 模型](https://nlp.gluon.ai/api/model.html#gluonnlp.model.RoBERTaModel)，并根据标准普尔500指数美国证券交易委员会2010年十年（从2010年到2019年）的10-K/10-Q报告进行了预训练。除此之外， SageMaker AI Industr JumpStart y：Financial还提供了另外两个Ro BERTa 变体 RoBERTa-SEC-WIKI-Large， RoBERTa-SEC-WIKI-Base并根据美国证券交易委员会的文件和维基百科的常用文本进行了预先训练。

导航到 “文本模型” 节点，选择 “**浏览所有**文本模型**”，然后筛选 “机器学习任务**文本嵌入**”，即可在中找到这些模型**。 SageMaker JumpStart 选择所选模型后，您可以访问任何对应的笔记本。配对的笔记本将引导您了解如何针对多模态数据集上的特定分类任务对预训练模型进行微调，Industry SageMaker JumpStart Python SDK 增强了这些任务。

**注意**  
模型笔记本仅用于演示目的。不应将其作为财务或投资建议。

以下屏幕截图显示了通过 Studio Classic 上的 SageMaker AI JumpStart 页面提供的预训练模型卡片。

![\[通过 Studio Classic 上的 SageMaker AI JumpStart 页面提供的预训练模型卡片。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-finance-models.png)


**注意**  
 SageMaker JumpStart 行业：财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录 [SageMaker AI 控制台](https://console.aws.amazon.com/sagemaker)，然后启动 SageMaker Studio Classic。有关如何查找模型卡片的更多信息，请参阅上一个主题，网址为[SageMaker JumpStart](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html)。

## Amazon SageMaker JumpStart 行业：财务示例笔记本
<a name="studio-jumpstart-industry-examples"></a>

SageMaker JumpStart Industry: Financial 提供了以下示例笔记本来演示以行业为重点的机器学习问题的解决方案：
+ **财务 TabText 数据构建** — 此示例介绍如何使用 SageMaker JumpStart 行业 Python SDK 来处理美国证券交易委员会的文件，例如基于自然语言处理分数类型及其相应单词列表的文本摘要和评分文本。要预览此笔记本的内容，请参阅[根据 SEC 申报文件的多模式数据集和 NLP 分数简单地进行构建](https://sagemaker-jumpstart-industry-pack.readthedocs.io/en/latest/notebooks/finance/notebook1/SEC_Retrieval_Summarizer_Scoring.html)。
+ **基于 TabText 数据的多模态机器学习** — 此示例说明如何将不同类型的数据集合并到一个名为多模态机器学习的数据框中 TabText 并执行多模态机器学习。要预览本笔记本的内容，请参阅 M [achine Learning on a TabText DataFrame — 基于薪资保护计划的示例](https://sagemaker-jumpstart-industry-pack.readthedocs.io/en/latest/notebooks/finance/notebook2/PPP_TabText_ML.html)。
+ **美国证券交易委员会申报数据的多类别机器学习** — 此示例显示了如何根据美国证券交易委员会申报为多类分类任务整理的多模式 (TabText) 数据集训练 AutoGluon 自然语言处理模型。[根据 MDNA 文本列将 SEC 10K/Q 身份文件按行业代码分类](https://sagemaker-jumpstart-industry-pack.readthedocs.io/en/latest/notebooks/finance/notebook3/SEC_MNIST_ML.html)。

**注意**  
示例笔记本仅用于演示目的。不应将其作为财务或投资建议。

**注意**  
 SageMaker JumpStart 行业：财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录 [SageMaker AI 控制台](https://console.aws.amazon.com/sagemaker)，然后启动 SageMaker Studio Classic。有关如何查找示例笔记本的更多信息，请参阅上一个主题，网址为[SageMaker JumpStart](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html)。

要预览示例笔记本的内容，请参阅[教程 — SageMaker JumpStart 行业财务](https://sagemaker-jumpstart-industry-pack.readthedocs.io/en/latest/notebooks/index.html) *Python SDK 文档*。

## 亚马逊 SageMaker JumpStart 行业：金融博客文章
<a name="studio-jumpstart-industry-blogs"></a>

有关使用 “ SageMaker JumpStart 行业：财务解决方案”、模型、示例和 SDK 的完整应用，请参阅以下博客文章：
+ [在 Amazon 中使用预先训练的金融语言模型进行迁移学习 SageMaker JumpStart](https://aws.amazon.com/blogs/machine-learning/use-pre-trained-financial-language-models-for-transfer-learning-in-amazon-sagemaker-jumpstart/)
+ [在 Amazon 中使用多模式机器学习使用美国证券交易委员会文本进行评级分类 SageMaker JumpStart](https://aws.amazon.com/blogs/machine-learning/use-sec-text-for-ratings-classification-using-multimodal-ml-in-amazon-sagemaker-jumpstart/)
+ [在 Amazon 中为财务 NLP 创建包含美国证券交易委员会文本的控制面板 SageMaker JumpStart](https://aws.amazon.com/blogs/machine-learning/create-a-dashboard-with-sec-text-for-financial-nlp-in-amazon-sagemaker-jumpstart/)
+ [在 Amazon 中使用图形机器学习构建企业信用评级分类器 SageMaker JumpStart](https://aws.amazon.com/blogs/machine-learning/build-a-corporate-credit-ratings-classifier-using-graph-machine-learning-in-amazon-sagemaker-jumpstart/)
+ [根据财务数据在 Amazon 中对基础模型进行域自适应微调 SageMaker JumpStart ](https://aws.amazon.com/blogs/machine-learning/domain-adaptation-fine-tuning-of-foundation-models-in-amazon-sagemaker-jumpstart-on-financial-data/)

## 亚马逊 SageMaker JumpStart 行业：金融相关研究
<a name="studio-jumpstart-industry-research"></a>

有关 “ SageMaker JumpStart 工业：金融解决方案” 的研究，请参阅以下论文：
+ [金融业中的情境、语言建模和多模式数据](https://www.pm-research.com/content/iijjfds/3/3/52)
+ [用于信用建模的多模式机器学习](https://www.amazon.science/publications/multimodal-machine-learning-for-credit-modeling)
+ [论神经文本分类器缺乏稳健可解释性](https://www.amazon.science/publications/on-the-lack-of-robust-interpretability-of-neural-text-classifiers)
+ [FinLex: 有效使用词汇嵌入生成金融词典](https://www.sciencedirect.com/science/article/pii/S2405918821000131)

## 亚马逊 SageMaker JumpStart 行业：其他财务资源
<a name="studio-jumpstart-industry-resources"></a>

有关其他文档和教程，请参阅以下资源：
+ [ SageMaker JumpStart 行业：金融 Python 软件开发工具包](https://pypi.org/project/smjsindustry/)
+ [SageMaker JumpStart 行业：金融 Python 软件开发工具包教程](https://sagemaker-jumpstart-industry-pack.readthedocs.io/en/latest/notebooks/index.html#)
+ [ SageMaker JumpStart 行业：财务 GitHub 存储库](https://github.com/aws/sagemaker-jumpstart-industry-pack/)
+ [Amazon A SageMaker I 入门——Machine Learning 教程](https://aws.amazon.com/sagemaker/getting-started/)