大模型重塑金融业态报告④丨金融大模型重塑技术能力-第一产经网

摘要:“大模型”无疑是2023年最热的关键词之一，随着大模型概念的崛起和广泛传播，金融行业因被视作最优落地场景也同步掀起了一轮热潮。大模型究竟会给金融行业带来什么？它会在何种程度上重塑技术和业务，会衍生出怎样的商业价值？21世纪资管研究院调研了三十多家金融机构和科技公司相关负责人，形成了这份《大模型重塑金融业态报告》，通过梳理机构布局情况以及这些领军者们的观点，描绘行业发展趋势。

21世纪资管研究院研究员李览青、杨梦雪

在金融机构基础设施升级后，当金融机构决定尝试大模型的落地应用，摆在其面前的首要问题是，如何部署大模型从而享受其带来的涌现能力与服务能力？

据21世纪资管研究院调研，大模型落地实现AI应用的路径有三个方向，一是基于现有开源大模型、基础大模型进行微调落地，二是与厂商联合创新自研大模型，三是通过API接口接入商用大模型或通过外挂知识库实现部分功能的使用。

但在企业AI应用的架构中，仅有大模型显然是不够的，大模型中间件、向量数据库等基础设施软件迎来新风口，而RPA技术也在与AI Agent融合后实现了新飞跃。

连接器:中间件

一直以来，金融机构不同系统间的互联互通与数据交换，都离不开中间件。如果说大模型是AI决策的“大脑”，那么中间件就是链接大脑与应用场景之间的“四肢”。

作为位于AI应用与大模型之间的中间层基础软件，这些组件在输入输出、数据转换、模型部署时发挥重要作用，解决了大模型落地过程中资源调度、数据集成、模型训练、应用集成、知识库与大模型融合等问题。在解决大模型商用化问题方面，中间件行业再次受到市场关注。

一方面，在计算机“分层”架构的基础上，引入中间层，可以实现不同业务中技术共性与服务共性的凝练，从而简化开发流程。虽然业务应用系统开发的逻辑有差异，但基础功能与系统服务是存在相似性的，基于这些相似性，可以尽可能凝练共性并复用，特别是在工程开发中基础、底层、公用的服务逻辑，通过中间件包装成简单、一致、集成的开发环境，从而实现程序设计、功能与服务编排的简化。大模型中间件的应用，可以帮助企业迅速构建出基于大模型的AI应用。

可以说，大模型中间件解决了大模型落地的“最后一公里”，既为上层应用访问大模型与知识库提供入口，也为大模型的应用部署提供桥梁。

21世纪资管研究院在调研中了解到，目前大模型中间件的生态在底层的动态资源调度之外，还有以AI Ops为代表提供一整套工具，帮助机构解决私有环境中大模型训练的工程问题，通过提供全自动化训练环境配置与构建，以低代码一站式完成数据接入、标注、监督微调、反馈强化学习和模型发布全流程，同时，可以支持数据回流及模型的持续迭代。

记忆体:向量数据库

在大模型“四肢”中间件之外，向量数据库作为大模型的“记忆体”成为大模型时代的必备基础设施工具之一。

向量数据库是专门用于存储和查询向量的数据库。在数学定义中，向量是有大小和方向的量，可以用带箭头的线段表示，箭头指向代表向量的方向，线段的长度代表向量的大小，两个向量之间的距离或相似性可以通过公式求得。到计算机领域，文本、图像、语音、视频等非结构化数据的向量化，可以存储到向量数据库中，从而实现对非结构化数据的相似性检索与搜索。

无论是通用大模型还是金融行业经过微调部署落地的垂直行业模型，都会出现信息时效性受限、大模型输入token受限、算力不足以及胡言乱语的“幻觉”等问题。

在信息时效性方面，由于机器学习训练需要一段时间，在这段时间内实时发生的资讯、新闻、市场行情等等快速变化，这些实时数据难以内置到模型中，需要一个外部的工具来存储这些实时信息，实现及时调用。

大模型的token限制是指，在大模型训练或推理时需要消耗大量计算资源，而这些资源是有限的，因此大模型输入的token是有限的，一旦突破这个设置，模型就会忘记上下文。根据每个大模型算力能力与工程化难度的不同，其token输入上限也有差异，如GPT-3限制2018个token、1024个汉字，GPT-4限制32000个token、16000个汉字。在输入限制下，需要一个外挂工具来存放诸多历史信息，为大模型提供长期记忆，避免上下文信息丢失等问题。

同时，向量数据库对于大模型专用显卡没有强依赖性，通过优化存储与索引方式，就可以在普通的硬件上实现高效向量处理，在金融机构算力有限的情况下，可以有效节约算力成本。

最后是大模型的“幻觉”问题。通用大模型出现“一本正经的胡说八道”的情况，在要求绝对准确的金融领域是不被允许的，在大模型精确度尚未达标的情况下，需要外挂知识库来补充大模型存在的知识缺陷，来使其可以给出准确的答案与更实时化的信息。

此外，对合规要求最严格的金融行业而言，出于对用户隐私数据与个人金融数据保护要求，向量数据库的访问权限设置也可以AI大模型将这些数据作为训练语料。

向量数据库具备低延迟查询、高可用、高性能、高扩展性等特性，成为金融机构部署大模型探索中的主流工具。特别是在图像搜索、问答交互、文本分类、智能推荐、语义分析、模糊数据匹配等场景下，应用前景广泛。

未来人工智能新形态:AI Agent

基于人工智能的RPA解决方案并不新鲜，金融机构通过RPA技术，让软件机器人代替业务人员完成各类软件系统操作与业务处理，实现业务流程链接与自动化处理，从而让人工专注于更有价值的工作任务。RPA的应用提高了员工的工作效率，减少了因人工疏漏导致的流程错误，也满足了跨系统流程连接与数据集成的需求。

但在金融机构的实践过程中，RPA的落地应用也存在挑战，其中最核心的问题是，业务流程并不是按预期一样一成不变的，面对动态业务环境，特别是对于不熟悉的场景，RPA可能出现崩溃，无法实现自适应变化，使得业务流程的稳定性难以保障。

AI Agent为RPA的进一步智能化提供了新的解决方案。AI Agent是一种能够感知环境、进行决策、执行动作的智能实体，相比传统的AI，AI Agent可以通过独立思考、调用工具来逐步完成给定目标。这与原本大语言模型的学习能力一脉相承，基于GPT-4等大语言模型规划与用户设定的目标，AI Agent可以在完成并添加新任务后，根据此前任务的结果为自己的工作流设置优先级，同时调用“记忆”，基于历史记录存储过去结果，在错误中学习更新知识，并自主调整任务。

这切中了传统RPA机器人工作中的业务痛点。当AI Agent+RPA，AI智能体获得了不断适应变化环境的能力，同时可以学习并实时洞察业务流程，根据用户需求自主完成工作流构建，将动态决策自动编排进入工作流程中，并主动执行处理完成相应的复杂决策。

未来，基于大模型驱动的AI Agent，被普遍认为是人工智能应用的新形态，相比于过去人工智能技术的相关应用，AI Agent表现出惊人的自主性与智能性，数据显示过去两年间针对AI Agent的研究投入增幅达到300%。

21世纪资管研究院梳理各大银行科技投入与科技人员数量发现，近两年来银行科技投入已开始出现下滑态势，科技人员新增数量也逐步减少。在云平台等基础设施建设已初步完成后，下一步是释放科技人员生产力。

AI Agent与RPA等传统技术结合，应用于金融服务的各类场景，以自主学习的能力可以及时解决非给定流程中的其他问题，在金融数据合规与隐私安全保护合规的情况下，有望成为金融从业人员与客户未来的AI助手。