工具&规则 · 深度调查 · near_source · Score 82

GLM-5.2 开源:MIT 许可下最强文本模型?

原始标题:GLM-5.2 is probably the most powerful text-only open weights LLM

一句话摘要

Z.ai:GLM-5.2 面向编码订阅用户开放,主打更强的长文本能力。

内部判断:推荐选题 · 证据较完整,有独立基准、官方发布、社区部署指南等多源交叉验证;老花人设解读角度清楚(开源模型成本账、部署门槛、许可风险);读者分层明确;泛兴趣故事钩子(最强开源模型、MIT许可、1/6成本)不夸张;传播张力成立(性能 vs 成本、开源 vs 闭源、中国模型数据风险)。逻辑基本能闭环,值得进入写作框架。

原始线索

Chinese AI lab Z.ai released GLM-5.2 to their coding plan subscribers on June 13th, and then yesterday (June 16th) released the full open weights under an MIT license. Similar in size to their previous GLM-5 and GLM-5.1 releases, this is 753B parameter, 1.51TB monster - with 40 active parameters (Mixture of Experts). GLM-5.2 is a text input only model - Z.ai have a separate vision family most recently represented by GLM-5V-Turbo , but that one isn't open weights. GLM-5.2 has a 1 million token context window, up from GLM-5.1's 200,000. The buzz around this model is strong. Artificial Analysis, who run one of the most widely respected independent benchmarks: GLM-5.2 is the new leading open weights model on the Artificial Analysis Intelligence Index . GLM-5.2 is the leading open weights model on the Intelligence Index v4.1. At 51, it leads MiniMax-M3 (44), DeepSeek V4 Pro (max, 44) and Kimi

为什么现在看:GLM-5.2 刚开源,MIT 许可,性能声称最强。

收集原则判断:ai-frontier

原始链接:https://simonwillison.net/2026/Jun/17/glm-52/

内部查证记录

推荐选题:证据较完整,有独立基准、官方发布、社区部署指南等多源交叉验证;老花人设解读角度清楚(开源模型成本账、部署门槛、许可风险);读者分层明确;泛兴趣故事钩子(最强开源模型、MIT许可、1/6成本)不夸张;传播张力成立(性能 vs 成本、开源 vs 闭源、中国模型数据风险)。逻辑基本能闭环,值得进入写作框架。

GLM-5.2 以 MIT 许可开源 753B 参数 MoE 模型,在 Artificial Analysis Intelligence Index 上以 51 分领先所有开源模型,并在部分编码基准上超越 GPT-5.5,成本仅为 1/6。这直接冲击开源模型格局,影响开发者选型、部署决策和商业风险判断。

报告来源:deepseek · 可信度 85 · topic-selection-dossier-v3

这件事目前能确认什么

核心问题:GLM-5.2 开源模型的实际性能、部署成本和适用场景是否值得开发者迁移或采用?

  • Z.ai 于 2026 年 6 月 16 日以 MIT 许可开源 GLM-5.2 权重。
  • 模型为 753B 总参数、40B 激活参数的 MoE 架构,文本输入,1M token 上下文窗口。
  • Artificial Analysis Intelligence Index 得分 51,领先 MiniMax-M3 (44)、DeepSeek V4 Pro (44)、Kimi K2.6 (43)。
  • 在科学推理(CritPt +16, HLE +12)、编码(TerminalBench +16, SciCode +7)等多项基准上较 GLM-5.1 显著提升。
  • API 定价:输入 $1.4/1M tokens,输出 $4.4/1M tokens,缓存命中 $0.26/1M tokens。
  • 自托管推荐 8x H200(vLLM FP8)或 4x H100(Q4 GGUF),社区已有 vLLM、SGLang 等推理引擎支持。
  • 存在中国数据风险:API 使用可能受中国数据法律约束。
  • 视觉模型 GLM-5V-Turbo 未开源。

时间线

  • 2026-06-13: Z.ai 向 coding plan 订阅者发布 GLM-5.2
  • 2026-06-16: Z.ai 以 MIT 许可开源 GLM-5.2 权重
  • 2026-06-17: Artificial Analysis 发布基准报告,GLM-5.2 得分 51 领先开源模型
  • 2026-06-17: 多家媒体报道,社区部署指南涌现

证据与依据

逻辑能不能闭环

证据链完整:发布 -> 基准 -> 定价 -> 部署 -> 风险。核心问题(是否值得采用)可从性能、成本、合规三个维度回答。性能有独立基准支撑,成本有 API 和自托管两种方案,合规风险有明确提示。逻辑可闭环。

可以继续追的方向

  • GLM-5.2 性能与成本账:API vs 自托管的经济学分析:直接服务核心技术人和商业读者,提供可操作的决策依据
    还需要:需要更详细的 API 成本对比和自托管硬件租赁价格
  • MIT 许可下的开源模型:GLM-5.2 的商业化风险与合规边界:针对高价值商业读者,揭示许可陷阱和数据合规问题
    还需要:需要 MIT 许可在 AI 模型上的具体解释,以及中国数据法律的权威解读
  • GLM-5.2 部署实战:从 HuggingFace 下载到 vLLM 推理:面向入门读者和核心技术人,提供 step-by-step 指南
    还需要:需要验证社区部署指南的准确性,补充常见问题
  • 开源模型格局重塑:GLM-5.2 如何影响 DeepSeek、MiniMax 等竞品:面向行业观察者和技术决策者,分析竞争态势
    还需要:需要更多竞品对比数据和市场份额信息

还缺哪些基础概念

  • MIT 许可在 AI 模型上的具体限制(如专利条款、数据使用)
  • 中国数据法律对 API 使用的影响(如数据出境、审查)
  • MoE 架构的推理效率与密集模型的对比

还缺哪些资料素材

  • GLM-5.2 在 LMSYS Chatbot Arena 等更多基准上的表现
  • 实际部署案例的成本数据(如 AWS、Lambda Labs 租赁价格)
  • 社区反馈和已知问题(如偏见、安全漏洞)
  • Z.ai 的视觉模型开源计划

不能写成结论的地方

  • GLM-5.2 是“最强开源文本模型”,除非有多个独立基准验证
  • MIT 许可意味着无任何限制,需检查具体条款
  • 1M 上下文窗口在所有场景下都有效,需验证长文本性能
  • 所有开发者都能轻松部署,需明确硬件门槛

下一步补证检索词

  • GLM-5.2 在 LMSYS Chatbot Arena 上的排名和 Elo 分数
  • GLM-5.2 的官方技术报告或论文
  • GLM-5.2 的量化版本(如 4-bit、2-bit)的性能和硬件需求
  • Z.ai 的 GLM-5V-Turbo 视觉模型是否计划开源
  • MIT 许可在 AI 模型上的法律解读(如专利条款)
  • 中国数据法律对使用中国 AI 模型 API 的具体要求

停止信号

  • GLM-5.2 在多个独立基准上被其他开源模型超越
  • Z.ai 修改许可条款或撤回开源权重
  • 出现重大安全漏洞或合规事件
  • 社区反馈显示部署成本远超预期或性能严重不达标

原始事实和证据入口

事实入口

  • confirmed_fact:Simon Willison's Weblog 发布/收录了这条原始线索:GLM-5.2 is probably the most powerful text-only open weights LLM 来源

已确认部分

  • 标题、来源 URL、来源类型、抓取时间已记录。
  • 该条线索来自稳定公开源,而不是强反爬论坛或截图转述。

证据入口

来源优先级:P1 高质量近源

GitHub Actions 稳定抓取:True

必须知道的边界

存疑点

  • 性能声称需独立验证

继续深挖方向

验证性能基准,对比 Llama 3、Qwen 等。

  • 继续追官方文档、价格页、GitHub 仓库、真实用户案例或反方证据。
  • 确认成本、门槛、合规、平台规则或岗位影响的具体边界。
  • 把所有无证据、弱证据和推断点显式标记,等待补证后再升级结论。

懂行人可能会挑刺

  • 不能把单条线索写成已验证机会。
  • 不能把技术可实现直接推导为商业可赚钱。
  • 涉及价格、收益、比例时必须继续找来源或公式。

不能写成结论

  • 不要声称老花已经实操验证。
  • 不要声称普通人都能复制。
  • 不要在证据不足时给完整行动方案。

后续补证入口

这里不替你决定是否写,只保留原始来源、证据入口、存疑点和继续检索词,供个人资产系统或人工判断引用。

继续检索词:

  • GLM-5.2 开源:MIT 许可下最强文本模型? 官方来源 原始公告
  • GLM-5.2 开源:MIT 许可下最强文本模型? 概念解释 证据
  • GLM-5.2 开源:MIT 许可下最强文本模型? 反方观点 局限