在数字化转型浪潮汹涌奔腾的当下,特别是当“新质生产力”、“人工智能+”被明确写入2024年《政府工作报告》,人工智能大语言模型正迅速成为新一轮产业革命的关键引擎,尤其在金融业这一数据密集型和科技驱动型行业中,金融AI大模型的应用已经成为推动金融创新、提升服务效率、优化风险管理的核心驱动力。
金融大模型的应用在金融科技创新中展现出多维度的价值。它不仅能够通过自然语言处理技术提升交互体验,实现服务的个性化定制。还能够为投资和风险管理提供深刻的洞察,提高决策效率。基于对客户需求的深度理解,金融大模型可以设计出更加符合市场趋势的金融产品。在确保金融机构遵守监管要求的同时,促进了金融普惠,使更广泛的中小企业和个人能够享受到高质量的金融服务。
为此列举一些我国金融科技大模型遇到的重要问题:1.如何提高金融大模型的泛化能力,以适应各种金融场景和提供安全可控的输出;2. 如何与传统机器学习与深度学习计算框架的集成,提供高效的大规模异构式的算力管理调度能力;3.如何针对金融行业场景提供高性能向量知识库及检索增强生成技术;4.如何开发工具箱提供用户在各种业务场景下方便的使用大模型的图文生成能力;5. 需要制定金融大模型通用能力与场景能力评估体系,有效提高大模型的优化方向;6.需要构建横向通用知识和纵向领域知识等高质量数据集,为金融大模型建设提供高质数据生产手段。
作为金融科技和人工智能领域的杰出专家,曾担任国有银行科技子公司的高级技术专家的方宁博士在金融大模型领域成果斐然,他提出的原创贡献“AI-FRIS” (AI-Driven Fintech Risk Innovation Solutions:Top plus strategic approach,AI金融科技风险创新:顶尖战略方案)在该领域具有重大的实践和理论价值。该方案提出了从技术和管理层面如何使用AI技术解决金融科技领域中技术创新与风险管理之间的平衡问题。
方宁博士在学术领域取得了卓越的成就,于上海大学获取了计算机工学博士学位,并在香港城市大学计算机系、新加坡南洋理工大学数学系、以及新加坡国立大学计算机学院继续他的博士后学术研究生涯。在苏宁云商任职资深算法工程师期间,方宁博士授权的《检索算法评估推荐方法和系统》等专利为国内企业和高校所引用;在陆金所AI实验室担任智能机器人团队经理期间,他首次提出了AI金融科技风险创新:顶尖战略方案“AI-FRIS”。基于此开发的一种交互式的智能理财机器人为科技创新和金融风险管理的实践应用提供了优秀解决方案。其成果在2019年世界人工智能大会上进行了展示,并被当年的Sina等主流媒体所报道。该项目申请的专利《系统评估方法、智能评估系统及计算机可读存储介质》被国内的AI领先企业百度和腾讯多次引用,研究成果已经在智能客服系统、电话语音营销系统、及客服质检系统等多种业务场景中被应用。
在国有银行科技子公司期间,方宁博士致力于全面提升金融大模型应用能力的研究工作。金融大模型平台是一个多层次、多组件的系统,具备应用、服务和基础能力层。它以AI技术为核心、以金融行业的真实数据为支撑,面向上层金融业务应用。自研金融大模型支持大规模高性能分布式训练,支撑千亿级规模金融大模型研发,实现金融大模型服务的高效运营。成为全球首家实现在低显存GPU上部署千亿参数大模型推理的金融企业。在方宁博士的领导下打造的金融研发平台通过对研发过程和工具的管理,打造应用大模型的完整技术体系,已经趋近完备。此外,方宁还构建设计了满足金融行业应用要求的专业大模型能力体系,涵盖信息总结、信息推断、金融知识等大模型能力。
2022年10月,方宁博士作为破题者和申报技术负责人的“AI 资金交易技术研究”项目成功获得科技部资助。项目针对银行间货币市场需求,重点攻关多轮对话、智能资金交易策略等人工智能技术,使之成为“货币政策传导器”和“金融市场稳定器”。方宁博士在此项目主要攻克的技术难点是通过人工智能技术赋能金融市场资金交易领域。具体来说,构建一个能够理解交易语言、具有智能交互能力的资金交易机器人,自动与其他交易员(可能是机器人)进行交易磋商并达成交易意向;基于人工智能算法对历史市场交易数据和新闻政策等舆情信息进行深层语义分析,通过组合优化建模,不断优化交易策略。
研究面向金融领域资金交易的对话场景,实现多轮对话策略学习。设计融合动态知识的金融领域的专用大语言模型,从金融外部知识融入、金融领域预训练数据采集、金融领域预训练任务设计等方面构建金融领域专用的大语言模型,为对话场景提供统一的对话框架。采用人工智能算法对资金面情绪指数进行建模。分析银行间市场资金面的影响因素,基于深度学习算法实现具有实际应用价值的银行间资金利率在不同周期内的预测。
目前,基于清洗后的研报以及开源数据集进行金融大模型继续预训练,对话机器人意图识别准确率和状态跟踪准确率超过90%;构建多个维度的交易员情绪指数模型对民生银行交易情绪指数基准进行拟合。基于强化学习的交易策略收益率相较于人工交易员提升了10%以上。构建了舆情采集分析模型库,形成了多源异构数据的管理与安全共享技术系统技术方案。其性能已经满足多家资金交易磋商平台的基本业务功能。
该项目是首批立项的长三角科技创新共同体联合攻关项目之一,同时是中国银行业首次由一个商业银行牵头实施的国家级项目,标志着我国金融科技领域的又一重要里程碑。