中金在线 > 财经 > 商业要闻

|商业要闻

豆包1.5·深度思考模型发布!效果好、低延迟、多模态

IT新闻网

|
  

随着 AI 技术的快速发展,AI 已从过去的感知 AI、生成式 AI,快速迈入 Agentic AI 时代。AI 正在进化出端到端的自主决策和执行能力,走向核心生产环节。   

  

火山引擎总裁 谭待

  

今天,在 FORCE LINK AI 创新巡展·杭州站,火山引擎公布了模型、Agent工具、云基础设施的最新进展,旨在帮助企业更快、更省地构建和部署Agent应用:发布豆包1.5·深度思考模型,升级豆包·文生图模型3.0、豆包·视觉理解模型。同时,面向Agent服务,发布OS Agent解决方案、GUI Agent大模型——豆包1.5·UI-TARS模型;面向大规模推理,发布AI云原生·ServingKit推理套件。

  

截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC报告显示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。   

  

  

深度思考模型能够让 AI 模拟人类的思维过程,对复杂问题进行精准分析和逻辑推导。

  

全新发布的豆包1.5·深度思考模型,在数学、代码、科学等专业领域推理任务中表现出色,已经达到或接近全球第一梯队水平;在创意写作等非推理任务中,模型也展示出优秀的泛化能力,能够胜任更广泛和复杂的使用场景。   

  

为了提升模型的通用能力,模型团队优化了数据处理策略,把可验证数据与创意性数据进行融合处理,满足各类任务的需求。此外,大规模强化学习是训练推理模型的关键技术,通过采用创新的双轨奖励机制,兼顾“对错分明”和“见仁见智”的任务,有效实现了算法的可靠优化。

  

豆包1.5·深度思考模型采用 MoE 架构,总参数为200B,激活参数仅20B,具备显著的训练和推理成本优势。基于高效算法,豆包1.5·深度思考模型在提供

加载全文
加载更多

精彩博文
×