随着人工智能技术的快速发展,金融行业正在迎来前所未有的智能化变革。
近日,2025金融科技大会“新型数字基础设施”在苏州举办。会上,百度智能云金融业务部总经理徐旭围绕金融行业的大模型基础设施建设,分享了百度智能云在过去几年深度参与金融机构智能转型的经验与观察。他指出:大模型已进入金融机构的高强度、真实业务负载阶段,AI 云全栈能力正成为金融行业迈入智能化跃迁期的关键引擎。
徐旭表示,目前国内已有金融机构在内部大模型服务上日调用量突破百亿 Tokens,逼近互联网级别的供给强度。这意味着大模型在银行、保险、证券等金融场景中的应用已从试点阶段全面进入规模化落地阶段。
与此同时,全球范围内的大模型仍在沿着 Scaling Law 快速扩展至万亿量级。尽管 PD 分离、MoE 架构等工程优化不断降低单 Tokens 成本,但超大规模模型依旧对金融行业的计算基础设施提出了前所未有的压力,形成“模型规模、算力成本、吞吐性能”难以同时最优的“三难困境”。
更重要的是,大模型的应用场景也在发生明显迁移:从内部辅助工具,快速向客户经理助手、客服助手、财富管理助手等前台、面客类业务延伸。这些场景要求更高并发、更低时延,使得金融行业必须重新思考如何构建可持续、可扩展的智能底座。
徐旭指出,金融机构不仅需要使用通用基础模型,也迫切需要围绕信用风控、交易监测、客户服务、合规审查等垂直场景构建“专精模型”。随着强化学习数据飞轮启动,模型训练已经从过去的“周级、天级”,加速进入“天级、小时级”的频繁迭代。
同时,为满足自主可控的要求,金融机构在底层算力层面临异构化挑战,这进一步加剧了智能基础设施的复杂度。在这一背景下,金融机构面临的核心命题可总结为四点:高效的算力供给、稳定的服务、灵活的共享调度、可持续的经济性。
随着人工智能技术的快速发展,金融行业正在迎来前所未有的智能化变革。
近日,2025金融科技大会“新型数字基础设施”在苏州举办。会上,百度智能云金融业务部总经理徐旭围绕金融行业的大模型基础设施建设,分享了百度智能云在过去几年深度参与金融机构智能转型的经验与观察。他指出:大模型已进入金融机构的高强度、真实业务负载阶段,AI 云全栈能力正成为金融行业迈入智能化跃迁期的关键引擎。
徐旭表示,目前国内已有金融机构在内部大模型服务上日调用量突破百亿 Tokens,逼近互联网级别的供给强度。这意味着大模型在银行、保险、证券等金融场景中的应用已从试点阶段全面进入规模化落地阶段。
与此同时,全球范围内的大模型仍在沿着 Scaling Law 快速扩展至万亿量级。尽管 PD 分离、MoE 架构等工程优化不断降低单 Tokens 成本,但超大规模模型依旧对金融行业的计算基础设施提出了前所未有的压力,形成“模型规模、算力成本、吞吐性能”难以同时最优的“三难困境”。
更重要的是,大模型的应用场景也在发生明显迁移:从内部辅助工具,快速向客户经理助手、客服助手、财富管理助手等前台、面客类业务延伸。这些场景要求更高并发、更低时延,使得金融行业必须重新思考如何构建可持续、可扩展的智能底座。
徐旭指出,金融机构不仅需要使用通用基础模型,也迫切需要围绕信用风控、交易监测、客户服务、合规审查等垂直场景构建“专精模型”。随着强化学习数据飞轮启动,模型训练已经从过去的“周级、天级”,加速进入“天级、小时级”的频繁迭代。
同时,为满足自主可控的要求,金融机构在底层算力层面临异构化挑战,这进一步加剧了智能基础设施的复杂度。在这一背景下,金融机构面临的核心命题可总结为四点:高效的算力供给、稳定的服务、灵活的共享调度、可持续的经济性。
徐旭强调,要破解这一复杂命题,关键在于跳出单一组件的思维,以“选用管”的系统化理念来重构智能基础设施。
百度智能云的独特优势在于其覆盖算力、模型到应用的AI云全栈能力,能够提供软硬一体、价值驱动的优化方案。在“选”与“用”的层面,百度智能云倡导以场景驱动,实现算力价值最大化。通过其自研的昆仑芯和百舸AI计算平台,为金融机构提供了高经济性和高适配性的算力底座。
昆仑芯P800不仅性能卓越,更易于部署。据项目实测,其仅需不到200卡规模的服务器集群即可完成千亿参数模型的全参数训练,可快速提升多模态数据分析、智能客服、代码助手等场景的应用效能,部分多模态模型推理性能达到行业领先水平。某股份制银行的案例显示,通过昆仑芯的集群部署,以不到百卡芯片的规模,高效支撑了热点流量窗口下日均百亿Tokens的大模型服务。
在“管”的层面,百度智能云推出了百舸AI计算平台,构建了“都江堰”式的算力治理体系。 面对昂贵且异构的算力资源,“百舸”平台实现了对底层智算云底座和昆仑芯的深度感知与统一抽象。它不仅能确保任务调度的高效匹配,更将保障金融业务的稳定可靠放在首位,通过故障的快速诊断、自愈和自动化隔离机制,确保了单一训练任务 99.5% 的高可用率。
更重要的是,百舸具备强大的异构资源池化和潮汐调度能力,能够统一管理和分配不同型号、不同地理位置的算力资源,通过资源超发和高优先级任务抢占,打破了算力孤岛,最大化了算力资源的共享和利用率。
徐旭表示,未来,百度智能云将持续以AI云全栈的整体优势,深度参与金融机构的智能时代基础设施建设,提供稳定、高效、经济的“核心引擎”,助力金融机构在服务实体经济、写好“五篇大文章”的进程中,抢占新一轮竞争的制高点。