金融机构的大模型AI+之路

金融行业进入AI Native的发展新阶段

“十四五”时期，金融行业的数字化建设积累了丰硕成果，同时也看到了数字化过程的巨大投入和业务数字化转型的深度与广度问题。2023年中央金融工作会议提出了做好数字金融等五篇大文章的新要求。当下AI大模型的横空出世和高速发展，正是数字技术金融应用的新机遇：让“想象力”变成“生产力”。

基座大模型发展节奏逐渐清晰，多模态、强化学习促进推理能力日益增强，AI Native的概念也被广泛接受。AI Native代表着人工智能深度融入业务流程和系统，使其成为业务的核心组成部分。在金融行业，构建AI Native的系统和应用意味着将人工智能技术与金融业务紧密结合，实现智能化的投资决策、风险管理、精准营销、客户服务、研发和运维等。

AI Native的发展也意味着计算架构、系统架构、应用和数据范式将产生一些根本性变化。在大模型的Scaling law法则中，算力、数据、算法是三个核心关键要素，随着金融企业对大模型的能力摸索实践越来越深入，更大的算力、更大规模或者更高质量的数据、更强的算法，是金融机构构建金融级AINative架构的三个关键考量点。

AI Native Infra：拓展云基础设施边界

大多数金融机构正在进行或已经完成了云平台建设，其中很多也参考公共云架构，组建了多地多中心多活架构和云原生体系。随着大模型应用场景的不断深入，无论是在训练或微调阶段对并行计算、高速网络和高性能文件存储的需求，还是推理阶段对弹性、时延、业务连续性的要求，都对如何基于云基础设施的能力实现异构算力的一体化管理、公专弹性一体化调度、端到端的监控和运维能力提出了新的挑战。

1.异构算力的统一管理。算力架构分散且利用效率不高是目前制约国内人工智能技术应用的一个瓶颈。通过算力虚拟化、池化等来屏蔽底层异构算力的差异，通过推理调度框架的显存优化、算子优化、编译优化等能力来实现不同性能算力的统一加速，是金融机构AI算力基础架构的必然选择。

2.算力的弹性供给和统一调度。随着大模型应用从试点走向更大规模的日常生产应用，支持推理应用的高并发，同时提供随时的弹性能力成为一种刚性需求。通过在特定高峰时刻将负载弹性到行业云、金融云等公共基础设施，可以较好地平衡效果与成本。

3.端到端的监控和运维。如果将大模型的训练过程比作开发，那推理就是典型的生产，如何在硬件层、模型层、应用层实现端到端监控和运维，确保大模型应用和传统交易类应用一样具备可观测性、业务连续性，成为大规模投产的关键前提。AI基础设施需要有全链路、高精度的监控数据用于性能分析和调度优化，以及更快速、更自动化的故障发现和隔离能力。

AI Native Data：激活一切数据资产

大多数金融机构已经完成了数据中台建设，并围绕结构化数据构建了“采建管用”等环节的能力，在一定程度上支撑了企业的经营决策、客户营销和风险管理等应用场景。但这些数据只占到金融企业整体数据的很小一部分，而且还会因为质量和工具等方面的原因，导致数据无法得到有效使用。推动企业更大范围数据与大模型的全面融合，不仅可以让大模型更好地学习和理解企业知识，还可以充分激活和挖掘数据的价值。我们称为构建DIKW，从数据信息转化为知识智能的新挑战。

1.多模态数据管理能力。金融机构拥有的更大规模的半结构化和非结构化数据可以更好地提升大模型应用的专业性和严谨性，数据中台需要升级对多模态数据的管理能力，包括采集、存储、向量化、知识图谱、查询等。一方面在训练阶段满足大模型对数据规模和多样性的要求；另一方面在推理阶段满足大模型对查询效率、响应时间及实时数据更新的要求。

2.数据工程的智能化。利用大模型能力构建智能化的数据工程，包括智能数据分析、智能数据探查、智能建模、智能全域数据集成、主动式数据资产治理等，以提升数据资产加工和处理的效率，提高数据质量，降低数据分析和应用门槛，提升用数体验，从而更大限度发挥数据资产的价值。

3.Data+AI全链路打通。为了更加高效地实现从数据到信息、再到知识和智能的过程，我们需要将之前分散的DataOps和MLOps打通，实现无论是在数据开发平台还是在AI开发平台中，都能够方便地完成数据的加工处理，模型的训练、发布和应用等整个链路。

AI Native Application：打造先进智能服务

伴随着金融机构云平台的建设，各类金融应用也实现了云原生相关的改造和优化，从狭义云原生的容器化、微服务、CI/CD、DevOps到广义云原生的单元化、服务网格、全链路可观测等。应用的云原生化实现了金融机构的数字化，对于下一站的智能化，如何将AI能力与金融业务紧密结合，实现智能化的风险管理、精准营销和客户服务等，是构建和管理金融应用面临的新挑战。

1.灵活开放的基础模型选择。大模型的能力决定了金融应用的智能化程度，目前国内大模型生态上有开源生态和闭源生态，在能力上有语言模型、语音模型、图像模型、视频模型，在尺寸上有0.5B、7B的小尺寸模型，也有72B、100B的大尺寸模型。除多样性外，模型的迭代速度也非常快，因此金融机构应该打造一个灵活开放的模型市场，兼顾性能、成本、开发、发展等因素，进行模型的选择、使用和汰换。

2.一站式模型应用工程服务。目前单靠基础模型的能力，还无法处理有复杂金融逻辑和较长流程的业务场景，另外为了满足金融专业性和严谨性的要求，还需要借助企业内部的结构化和非结构化数据，对基础模型进行知识增强和结果验证。一站式的大模型应用开发平台可以极大地降低开发门槛，提高开发效率，在模型训练阶段，提供数据处理、训练微调、模型评测等能力，在模型应用阶段，提供RAG、Agent、Mult Agent等工程化的能力。

3.多智能体的构建和融入。在大模型时代，每一个应用都值得被智能化重做。智能体作为一个能够自主执行任务的新形态应用，具备更强的自主能力、交互能力和学习能力，能够在复杂环境中优化其行为策略，实现预定目标。自主能力指智能体能够自主执行任务，减少进行提前的程序预设，例如在投顾领域，智能体会根据市场趋势和个人偏好提供建议；交互能力智能体可以与用户进行自然的交互，提升用户体验，例如在客户服务领域，可以通过自然语言处理技术与用户进行对话，提供信息查询、预订服务等功能；学习能力指许多智能体具有自我学习和适应环境变化的能力，能够随时间推移改进自身性能，例如在智能营销中，智能体可以根据用户的行为模式调整推荐策略。

近十年来，阿里云深度参与了国内金融行业信息化和数字化的进程，在推动金融机构从传统架构向先进架构演进的过程中，贡献了自己的一份力量。在汹涌而来的智能化时代，阿里云在算力、数据、算法等方面专为金融客户提供了一揽子解决方案：在算力层面，除了为客户提供专有云环境下普算智算一体化的异构资源管理和运维方案外，还提供了满足合规和安全要求的金融云和公共云资源弹性方案；在数据层面，对原有数据中台方案进行了升级，实现Data+AI的双向赋能；在算法层面，为金融客户提供了全模态、全尺寸、广开源的基础模型，以及一站式大模型应用开发平台“通义点金”。

未来，阿里云将坚定不移地加强与金融客户共研、与合作伙伴共建，持续推动金融行业大模型应用的技术创新，通过不断深入理解金融行业的特性和需求，助力金融机构更高效、更智能地服务实体经济，为做好金融“五篇大文章”贡献数字金融的坚实力量。