AI 晨报 · 7月1日

今日 AI 晨报涵盖四大重磅消息:DeepSeek V4 旗舰开源、月之暗面 Kimi K2.6 发布、智谱 GLM-5.2 全量开放、华为昇腾 950PR 芯片进入规模化出货阶段。

DeepSeek V4 正式发布:1.6万亿参数开源旗舰,支持百万 Token 上下文

2026年4月24日,深度求索正式发布并开源其旗舰级模型 DeepSeek V4 系列,分为 V4-Pro 和 V4-Flash 两个版本。V4-Pro 总参数达 1.6 万亿(1.6T),激活参数 490 亿(49B);V4-Flash 总参数 2840 亿(284B),激活参数 130 亿(13B)。两个版本均采用 MoE 架构,原生支持 100 万 token 超长上下文。

DeepSeek V4 引入创新性的 Engram 架构,通过跨层共享参数与动态路由机制,在不显著增加推理计算量的前提下大幅提升了模型的表达能力和知识容量。API 定价约为竞品的 1%。2026年6月28日,DeepSeek 联合北京大学发布 DSpark 推理加速框架,采用推测解码与动态投机采样技术,使 V4 系列在各种硬件架构上的吞吐量提升 57%-78%,同时实现从 CUDA 到华为 CANN 的底层代码重写。

数据来源:DeepSeek 官方公告、MIT Technology Review

月之暗面 Kimi K2.6 开源发布:原生多模态 Agent,支持 300 子智能体并行

2026年4月,月之暗面正式发布并开源其最新模型 Kimi K2.6,采用 MoE 架构,总参数约 1T,激活参数约 32B。在 Humanity Last Exam、SWE-Bench Pro 等权威基准测试中,多项成绩持平或超越 GPT-5.4 和 Claude Opus 4.6。

Kimi K2.6 支持最长 13 小时不间断编码任务,单次会话可生成超过 4000 行代码;支持 300 个子智能体并行执行,最多可完成 4000 个协作步骤。月之暗面同期推出 Kimi Claw 产品,用户无需自备硬件即可在网页端使用 Agent 能力。据 Stripe 数据,2026年1月个人订阅支付订单数环比增长超 8000%。

数据来源:月之暗面官方公告、腾讯云开发者社区

智谱 GLM-5.2 全量开放:开源模型在代码安全领域首次超越 Claude Code

2026年6月,智谱 AI 正式发布并开源其旗舰模型 GLM-5.2,采用 MoE 架构,总参数约 750B,激活参数约 40B,支持 1M token 超长上下文,遵循 MIT 协议开放模型权重。

在 Semgrep 网络安全漏洞检测基准中,GLM-5.2 以裸提示词获得 39% F1 分数,超越 Claude Code 的 32%。在 Terminal-Bench 达到 81.0 分,在长程编码任务上击败 GPT-5.5,而成本仅为后者的约 1/6。

数据来源:智谱 AI 官方公告、VentureBeat

华为昇腾 950PR 规模化出货:FP4推理性能达英伟达 H20 的 2.87 倍

2026年3月,华为发布搭载昇腾 950PR 处理器的 Atlas 350 加速卡,正式商用。昇腾 950PR 基于 SIMD 架构,FP4 精度算力达 2 PFLOPS,HBM 128GB、带宽 1.6TB/s。单卡 FP4 推理性能达英伟达 H20 的 2.87 倍,是国内首款支持 FP4 低精度的推理产品。

据英国《金融时报》报道,华为计划 2026年生产约 75 万颗昇腾 950PR 芯片,全年 AI 芯片营收预计约 120 亿美元,较 2025 年增长 60%。字节跳动、腾讯、阿里巴巴等已启动大规模采购。华为已规划 2026年第四季度推出升级版 950DT 芯片。

数据来源:英国《金融时报》、华为合作伙伴大会官方发布、IDC

2026世界人工智能大会将于7月17日在上海开幕

2026世界人工智能大会(WAIC)将于7月17日至20日在上海世博展览馆举办。大会以「智能伙伴,共创未来」为主题,设置论坛会议、展览展示、评奖竞赛、应用体验、创新孵化和人才招聘六大板块,计划举办超 140 场主题论坛,汇聚超 1400 位国际嘉宾,总展览面积超 10 万平方米。

大会将围绕芯片算力、大模型、AI Agent、具身智能等前沿议题展开讨论,预计吸引 30 万名观众和 1100 家参展企业。

数据来源:新华网、上海市经济和信息化委员会、WAIC 官方