文 / 熊逾格
编辑 / 陈锋
7 月末,上海世博展览馆人潮如织,2025 WAIC 迎来史无前例的热度。
科技盛宴背后,2025 年以来,国内大模型产业的三大趋势愈发清晰,竞争版图正在重塑:
推理模型成为新的技术制高点;应用落地从概念走向实战;国产算力迎来突破性进展。
从 DeepSeek 的开源风暴到华为昇腾 384 超节点的首次亮相,从"六小虎"的差异化布局到巨头的全面反击,大模型正告别"百模大战"的混沌期,步入更加理性而激烈的"中场战事"。
WAIC 2025 现场,图源世界人工智能大会官方微信公众号
我们看到,2025 WAIC 上,在去年显得低调的机器人产业变得火热,相关公司由 2024 年的 18 家剧增到 80 家,占领几乎整个展馆二层 H3 展馆,火热非凡。而大模型厂商们则主要集中在一层 H1 展馆。
今年," AI 六小虎"中的零一万物、百川智能并未现身, BAT、科大讯飞等头部厂商展位不再专注比拼模型参数,而是展示出多样的落地生态。
如今,大模型竞争已不再是单纯的技术军备竞赛,而是一场关乎产业生态、商业模式和国际竞争力的综合较量。当大模型从实验室走向产业一线,推理能力成为新的分水岭,国产化成为不可逆转的趋势,每一个参与者都在重新审视自己的定位和实力。
一场推理模型的"百花齐放"
如果说 2025 年以前的"百模大战"更多是在基础能力上的比拼,推理模型则代表了从"能回答"到"会思考"的质的飞跃。
这一转折点的标志性事件,无疑是 DeepSeek-R1 的横空出世。
据业内分析,DeepSeek-R1 的训练成本仅为 560 万美元,远低于美国 AI 公司的数千万美元乃至数亿美元投入。更重要的是,这一技术突破开启了推理模型的"平民化"路径,让原本高不可攀的 AGI 研究变得相对可及。
面对变局,头部厂商迅速跟进。WAIC 上推理模型的"百花齐放",阐释着大模型竞争规则的变化。
据不完全统计,自 2025 年 1 月 DeepSeek-R1 发布以来,头部厂商和大模型创业公司,在在短短数月内相继推出了自己的推理模型。
3 月,腾讯发布混元 T1 正式版,百度发布文心 X1;阿里发布 QwQ-32B 推理模型;
4 月,字节发布 Seed-Thinking-v1.5;阿里发布通义千问 Qwen3 推理模型;
6 月,腾讯发布混元 -A13B;
7 月,智谱发布 GLM-4.5,阶跃星辰发布 Step3,科大讯飞星火 X1 迎来第二次升级,月之暗面发布 Kimi K2。
WAIC 2025 的腾讯展台,图源腾讯优图实验室官方微信公众号
WAIC 前后,国内大模型厂商展示自家最新推理模型,呈现出在技术路线上明显的差异化策略,主要体现在模型架构、推理机制、参数策略及成本三方面:
首先是架构选择、创新的分野。大模型架构从纯 Transformer 走向混合架构时代,单一架构已无法满足推理模型的性能需求,混合架构成为新的技术制高点。
腾讯的混元 T1 正式版,摒弃纯 Transformer 架构,转而将混合 Mamba 架构应用于推理大模型,实际生成速度快于 DeepSeek-R1;
月之暗面的 Kimi K2、阿里的 Qwen3 推理模型、字节的 Seed-Thinking-v1.5、智谱的 GLM-4.5、阶跃星辰的 Step3 均采用 MoE 架构。
其次是推理机制创新,更适合场景应用以及 Agent 发展。
百度的文心 X1,采用"思维链 - 行动链"协同训练,在复杂任务中自动拆解为二十多个推理步骤,同时可以调用十几种的工具链,增强 Agent 的能力;
科大讯飞的星火 X1 使用"快思考 + 慢思考"统一模型架构,通用推理能力与专业领域推理并重;
月之暗面的 Kimi2 主打代码能力和 Agentic 任务处理,针对软件工程任务进行了专门优化;
阶跃星辰的 Step3 创新引入 MFA 注意力机制和 AFD 分布式推理系统;
智谱的 GLM-4.5 首次在单个模型中实现推理、编码和智能体能力的原生融合,支持思考模式和非思考模式切换。
最后是参数策略的强调,在效率、成本、速度之间寻找平衡。
Kimi K2 拥有 32B 激活参数和 1T 总参数 , 是目前业界总参数量最大的开源模型;
Seed-Thinking-v1.5 参数量降低至 200B 总参数和 20B 激活参数,轻量化趋势明显;
阿里 QwQ-32B 采用 32B 参数规模,显存需求控制在 24GB,大幅降低部署门槛;
腾讯混元 A13B 总参数 80B、激活参数仅 13B,1 张中低端 GPU 即可部署。
WAIC 2025 阿里展台,图源通义灵码官方微信公众号
当下,推理模型的竞争已不再局限于参数规模和算力消耗,模型的推理链条设计、多步骤逻辑处理能力以及与下游任务的适配性,正成为新的评价维度。
这场推理模型的军备竞赛,实质上是各家厂商对未来 AI 发展方向的不同押注。开源还是闭源,通用还是专用,效率还是效果,每一个选择都将决定其在下一阶段竞争中的位置。
而随着推理模型技术的日趋成熟,真正的较量更转向应用场景的争夺。
从 B 到 C,大模型落地拼什么?
在推理模型解决"思考"问题后,应用落地展示出"为谁想"和"想什么"的关键方向。2025 年的 WAIC 展会上,最引人注目的变化莫过于大模型从"技术展示"向"应用实战"的转变。
这一转变首先体现在 WAIC 厂商策略的分化上——互联网巨头依靠平台生态及能力,不断在 B 端、C 端广泛布局;专业模型厂商选择垂直赛道深化,选择 B 端作为突围出口。
其中,腾讯展示出混元大模型"从云到端"的完整展示链路,以及 B 端金融分析助手、智能视频剪辑、媒体内容生成等内容,颇为吸睛的亮点在于社交——在微信中添加"腾讯元宝"好友,能让 14 亿微信用户像加好友一样接触 AI 助手。
阿里侧重在 AI 工具带给生活的便利性。
比如,通义大模型技术底座支撑下,天猫精灵全屋智能构建的空间智能体系,让用户现场体验 AI 影音搜推、AI K 歌、AI 健身等丰富场景;通义 APP 融合 AI 翻译、AI 对话、AI 语音通话三大功能,成为用户的"贴身伙伴"。
通义千问 + 钉钉办公智能体能够自动生成项目推进表、会议纪要、日报汇总,集成知识库管理、权限控制与 RPA 能力。
百度聚焦百舸 GPU 算力平台、"万源"智能计算操作系统等 AI 基础设施,配合文心大模型技术底座,进而推出慧播星、文心快码、"万源"智能计算操作系统、AI 升级的百度文库及百度网盘等产品。
WAIC 2025 百度展台的网盘、文库展示,图源百度网盘服务号官方微信公众号
另一方面,Kimi、智谱 AI 等厂商缺乏大厂的流量优势,展示内容更加注重 B 端能力。
其中,Kimi、智谱 AI,对标 Claude 偏向强调编程、智能体的能力。
智谱 AI 的 CogAgent 平台支持训练个性化对话体,快速封装为智能客服、内容助手等角色,并拥有私有知识库、多模态 API 与流程自定义等功能。智谱此前表示,GLM-4.5 的 API 价格仅为 Claude 的 1/10,速度可达 100tokens/ 秒。
Kimi 推出 Kimi-Researcher 深度研究智能体,新推出的 Kimi K2 在代码能力和 Agentic 任务处理上优势明显,也能够完成 AI 商务写作 + 智能表格分析一体化流程。
WAIC 2025 的 kimi 演示" AI 商务写作 + 智能表格分析"一体化流,图源蓝驰创投官方微信公众号
"六小虎"的其中两家,Minimax 和阶跃星辰则更加注重多模态能力。
阶跃星辰新一代多模态大模型 Step 3 能力覆盖文字、语音、图像、视频、音乐、推理,称国内 Top10 手机厂商过半都已接入阶跃的多模态能力,OPPO、荣耀、中兴的旗舰机型都已搭载适配,合作伙伴还包括吉利汽车、智元机器人等企业,预计 2025 年全年收入近 10 亿人民币。
MiniMax 的 MiniMax Agent 智能体平台,能够进行长程复杂任务处理,替代专业人士一周工作量,深入网页开发、深度调研等垂直领域应用,支持钉钉、飞书、企业微信等办公系统集成。
不难看出,在应用形态上,Agent 成为最具想象力的落地方向。
但根植于当下环境——近期 C 端通用 Agent 明星产品 Manus 总部迁移至新加坡、国内裁员 80 人并放弃国内版本上线,大模型厂商们更注重垂直 Agent 能力的开发。
以落地场景来说,值得关注的还有大模型在垂直行业的渗透加速。
例如,在金融领域,风控、投顾、客服等环节都在积极引入大模型技术;在医疗领域,诊断辅助、药物研发、病历管理等应用场景不断涌现;在制造业,智能质检、预测性维护、供应链优化等用例逐步落地。
综合来看,大模型的应用落地实际上是一场综合实力的竞赛。
技术能力是基础,但产品化能力、生态整合能力、客户服务能力同样重要,能够在这些维度上形成差异化优势的厂商,才有可能在应用落地的竞争中胜出。
国产算力曙光乍现
在大模型产业的所有变量中,算力无疑是最具战略意义的一环。
近期,黄仁勋访华为国产算力发展提供新的视角。在接受央视采访时对,黄仁勋表示华为 AI 芯片取代英伟达或许只是时间问题,也让人更加期待国产算力的潜力。
据公开资料,阿里、字节跳动近几个月的日均 Token 调用量增长相比一年前均接近、超过 100 倍,这种爆发式增长对算力供给提出了巨大挑战。
在 2025 年的 WAIC 展会上,国产算力展现出前所未有的实力和信心。
作为"八大镇馆之宝"之一,华为昇腾 384 超节点首次实机展出。昇腾 384 超节点基于超节点架构,通过总线技术实现 384 个 NPU 之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。
WAIC 2025 的华为昇腾 384 超节点,图源世界人工智能大会微信公众号
这样的突破意义不仅在于算力规模的提升,更在于为国产大模型训练提供了可靠的底层支撑。
国产 GPU 厂商的表现同样令人瞩目。燧原科技的新一代人工智能推理加速卡"燧原 S60 ",对标英伟达 L20,搭载了 48G 显存和 PCIe 5.0 接口,支持各种主流推理框架和 200+ 主流模型,可满足千亿参数大模型的推理需求。
在今年 2 月与美图旗下美颜相机的合作中,燧原科技仅用 4 天时间就完成了近万张推理卡的上线部署,解决" AI 换装"功能爆火带来的需求。
此外,国产算力还展现出从单点突破转向生态协同的趋势。7 月,阶跃星辰联合华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯等近 10 家芯片及基础设施厂商发起"模芯生态创新联盟"。
国产算力的发展仍面临诸多挑战。在芯片性能上,国产算力与国际先进水平仍有差距;在软件生态上,开发工具链和优化算法还需要进一步完善;在大规模部署上,稳定性和可靠性还需要更多验证。
但我们不妨更加乐观。技术路径的多样化为后发追赶创造了机会,庞大的国内市场为产业化提供了基础,政策支持为创新发展提供了保障。
更重要的是,WAIC 上 AI 产业呈现出的快速发展,更让人看到国产算力发展的历史性窗口。
结语
当 WAIC 的热潮逐渐退去,大模型产业的"中场战事"才刚刚开始。这不再是一场单纯的技术竞赛,而是涉及技术路径、商业模式、生态建设和国际竞争的全方位较量。
中场战事的核心特征是分化与聚焦。
分化体现在技术路径的多元化、应用场景的专业化和商业模式的差异化;聚焦则体现在核心技术的攻坚、关键应用的突破和生态护城河的构建。
这种变化趋势预示着大模型产业正在从高速扩张期进入精耕细作期。
展望未来,三大趋势将继续深化:推理模型将从当前的逻辑推理扩展到多模态推理和具身智能推理;应用落地将从工具型应用发展为平台型应用和生态型应用;国产算力从追赶模式转向比拼模式,在某些细分领域实现领先。
中场战事的胜负,最终将由应用价值和用户选择来裁判。WAIC 热潮落幕后,留在舞台中心的国内大模型产业路在何方,仍待进一步验证。
论坛股票配资提示:文章来自网络,不代表本站观点。