点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

共话金融领域大模型可信应用建设
——《大模型金融可信应用参考框架》标准研讨会在京举行
近日,由中关村金融科技产业与发展联盟、中关村互联网金融研究院主办的“《大模型金融可信应用参考框架》标准研讨会(闭门会)”在北京成功召开。本次研讨会作为2025中关村论坛系列活动—数字金融与科技金融大会的重要组成部分,定向邀请了多位知名行业专家和二十余家标准共建单位代表出席,共同探讨大模型在金融领域落地应用的可信挑战、实践路径与标准建设。

新一代AI正在重塑金融业,大模型在金融核心场景的广泛应用催生了新型风险,亟需系统性治理。在此背景下,由来自科技企业、金融机构、科研院所及行业协会等领域的26家单位联合制定的《大模型金融领域可信应用参考框架》(以下简称《参考框架》)团体标准在数字金融与科技金融大会主论坛正式发布。
框架核心解码:以工程化破大模型金融可信困局
金融行业对可靠性的高要求,与当前大模型的实际表现之间存在差距。研讨会上,蚂蚁密算董事长韦韬介绍了《参考框架》的筹建背景和核心理念。当前大模型普遍存在的“幻觉”、规模任务下的性能崩塌等问题,是阻碍大模型在专业领域深度应用的最显现障碍。融合了工程化和智能化的高阶程序HOP提供了解决之道,其核心理念是采用系统工程的思维,将大模型视为一个功能强大但存在一些行为不确定性的核心处理单元,在其周围构建一个确定性的、专业严谨的、可验证的控制与保障体系,从而在系统层面确保最终结果的可信。

金融业因其必须与互联网连接的逻辑特性,始终面临安全、便捷与成本的平衡难题。国家信息技术安全研究中心金融安全部部长曹岳为参会嘉宾介绍了智能化时代网络金融安全态势。他表示,当前已进入数字化、智能化安全新阶段,其特征是攻击与防御趋向于“智能对智能”的对抗。人工智能在提升攻击效率的同时,也为防御体系带来了动态自适应、主动防御和跨层协同的新机遇,需要通过实施“分层治理”、转向“技术架构数据驱动”、发展“安全智能”等策略进行应对。

钱塘征信有限公司CEO李臻阐述了征信行业在大模型与数据要素化背景下的发展机遇与实践。他指出未来5到10年,个人信用数据将趋向“平权”,即在用户授权下,基于场景的数据应用将更为均等,金融机构的核心竞争力将转向基于数据的模型加工与科技应用能力。钱塘征信与蚂蚁密算在浙江省公共数据授权运营领域的创新合作,通过搭建“可信数据空间”,在数据原始不出域、充分保障隐私安全的前提下,实现了政务数据在个人信用服务领域中金融、商业场景的安全协同计算。

专家智囊献策:为标准升级与落地指明方向
《大模型金融领域可信应用参考框架》的筹备、完善与评审过程中,收到了多位行业专家的指导建议。研讨会标准评审专家发言环节,全国网络安全标准化技术委员会WG4工作组副组长、国家信息中心原首席工程师李新友结合最新政策表示,金融是大模型应用的最佳试验场之一。他建议,标准发布后应通过试点示范不断完善条文,增强其普适性,并积极争取从团体标准升级为行业标准或国家标准,以凝聚更广泛的行业共识。

清华大学人工智能研究院听觉智能研究中心主任郑方从技术原理角度提出两条增强可信的路径:一是深度融合垂直领域知识,如利用知识图谱等技术,将人类总结的精华知识与大模型的数据驱动能力结合;二是建立对大模型输出结果的“可信度评估”机制,当模型置信度不足时,应具备主动提示或不决策的能力,从而有效控制风险。

中国科学院软件研究所研究员、全国网络安全标准化技术委员会委员张立武探讨了“幻觉”产生的机理与治理思路。他认同《参考框架》中强调的“可验证性”思路,并强调需进一步明确和统一“知识”等关键概念的定义,将构建高质量知识库作为核验基准,通过外部验证机制保障输出可信度。

共建单位发声:实践视角谈标准价值与期望
来自邮储银行、公安部第三研究所等保中心、赛博英杰、蚂蚁密算、东方证券和国投证券的专家,作为标准的核心共建单位代表,分享了对标准的思考和建议。
邮储银行安全攻防专家赵汉杰表示,《参考框架》为金融机构在落地大模型应用时提供了清晰的安全路线图和权责划分依据,解决了不同部门关注点零散、难以整合的痛点,期待标准能提供更细化的实施细则和优秀实践案例,增强可操作性。
公安部第三研究所等保中心主任助理王勇指出,金融等高风险场景对大模型可信性要求极高,参考框架通过引入可信执行引擎和程序化业务逻辑库来管控幻觉,具有重要价值。他建议未来标准需进一步研究如何评价不同场景下的可信度达成情况,并思考如何将框架覆盖到模型全生命周期,而不仅是运行态,同时应关注框架与现有安全要求的融合。
赛博英杰科技有限公司创始人谭晓生将此次标准的制定类比于软件工程领域的CMM认证,认为这是通过流程、工具和核验来解决技术(或人)本身不可靠性的成熟思路的延续,对产业健康发展至关重要。
蚂蚁集团基础安全事业部总经理王宇结合安全领域的实践指出,安全运营本身具有强烈的SOP属性,从SOP迁移到HOP是自然过程。大模型的泛化能力结合HOP框架,能显著提升安全智能化的水平。他强调,需训练大模型具备在信息不足时主动交互确认的能力,并认为大模型正在重构安全工作范式。
东方证券代表张庆分享了券商业务的实践困境,指出不同业务场景(如风控与投研)对“市场资讯”等同一任务的定义和标准差异巨大,单纯依赖模型微调难以奏效。参考框架提供的SOP梳理和工程化方法更具指导意义。他同时提到,让模型自我核验同样面临挑战,期待未来有更多针对核验机制的成功案例分享。
国投证券专家李维春高度评价了标准的质量,认为其对“可信”的定义清晰务实,概念体系完备,得到了业务、风控、合规等多方同事的认可。他坦言在深入了解HOP理念后,对标准的理解更为深刻,认为其价值巨大,可组织在行业内进一步研讨以凝聚共识。

思想交锋时刻:聚焦痛点共探未来落地路径
在自由讨论环节,与会嘉宾围绕大模型在金融领域应用的“可信性”痛点、标准的应用实践,以及对未来的需求等多个方面展开热烈交流,现场思想碰撞频繁,诸多真知灼见为《参考框架》的落地与深化建言献策。
1. 聊“可信性”痛点
与会专家普遍认为,大模型在金融领域的应用,其核心痛点在于“可信”并非一个可简单达成的静态结果,而是一个需要持续管理的动态过程。痛点主要集中在三个方面:首先是事实准确性与幻觉问题,大模型“一本正经胡说八道”的特性在严谨的金融业务中是致命的,例如利率、产品条款等关键信息不容有任何差错;其次是复杂任务的可控性,当任务步骤复杂时,大模型的推理严谨性不足,可能出现逻辑跳跃或错误;最后是合规与安全的底线挑战,金融业务对数据分类分级、合规审查有极高要求,大模型输出的不确定性与这些刚性要求之间存在巨大张力。大家认识到,不能指望训练一个“永不犯错”的模型,而必须通过体系化的架构和方法来确保即使模型出错,整个系统仍是安全可信的。
2. 谈可信应用实践
在实践层面,讨论形成了几个关键共识。核心思路是通过“工程化”和“框架化”来约束和引导大模型。一个重要的实践路径是智能体(Agent)架构,特别是像HOP(高级程序化)这样的框架,通过将复杂任务拆解为可验证的原子步骤,并对每一步进行交叉核验,显著提升了任务执行的可靠性和准确率。此外,构建领域专用的知识库和知识图谱,为模型提供精准的知识供给,被认为是提升专业领域推理能力的关键。多家机构也分享了他们在输入输出内容安全过滤、构建内部评测机制等方面的具体经验。
3. 说2026年实践需求
对于未来的实践需求,讨论热烈而深入,焦点集中在如何让标准“落地生根”。首要需求是分场景的深化与标准化,希望未来能针对金融业的具体场景(如数据治理、智能风控、合规审查等)制定更细化的实践指南、检查清单(Checklist)和评测数据集,使标准更具可操作性。其次,强烈呼吁建立 “最佳实践”案例库和开源工具生态,通过可参考、可复用的成功案例和便捷的工具链,降低各机构的实践门槛。第三,期待构建分层、可量化的评测认证体系,这可能包括行业级的通用基准测试和企业级的私有化评测,并探索与采购标准、行业准入挂钩的可能性,以形成正向激励。
与会专家一致表示,希望凝聚行业合力,共同推动该参考框架从团体标准走向行业乃至国家标准,为金融AI的规模化可信应用奠定坚实基础。(田津金 李政葳)
