工具&规则 · 深度调查 · near_source · Score 82

GLM-5.2 开源：MIT 许可下最强文本模型？

原始标题：GLM-5.2 is probably the most powerful text-only open weights LLM

一句话摘要

Z.ai：GLM-5.2 面向编码订阅用户开放，主打更强的长文本能力。

内部判断：推荐选题 · 证据较完整，有独立基准、官方发布、社区部署指南等多源交叉验证；老花人设解读角度清楚（开源模型成本账、部署门槛、许可风险）；读者分层明确；泛兴趣故事钩子（最强开源模型、MIT许可、1/6成本）不夸张；传播张力成立（性能 vs 成本、开源 vs 闭源、中国模型数据风险）。逻辑基本能闭环，值得进入写作框架。

原始线索

Chinese AI lab Z.ai released GLM-5.2 to their coding plan subscribers on June 13th, and then yesterday (June 16th) released the full open weights under an MIT license. Similar in size to their previous GLM-5 and GLM-5.1 releases, this is 753B parameter, 1.51TB monster - with 40 active parameters (Mixture of Experts). GLM-5.2 is a text input only model - Z.ai have a separate vision family most recently represented by GLM-5V-Turbo , but that one isn't open weights. GLM-5.2 has a 1 million token context window, up from GLM-5.1's 200,000. The buzz around this model is strong. Artificial Analysis, who run one of the most widely respected independent benchmarks: GLM-5.2 is the new leading open weights model on the Artificial Analysis Intelligence Index . GLM-5.2 is the leading open weights model on the Intelligence Index v4.1. At 51, it leads MiniMax-M3 (44), DeepSeek V4 Pro (max, 44) and Kimi

为什么现在看：GLM-5.2 刚开源，MIT 许可，性能声称最强。

收集原则判断：ai-frontier

原始链接：https://simonwillison.net/2026/Jun/17/glm-52/

内部查证记录

推荐选题：证据较完整，有独立基准、官方发布、社区部署指南等多源交叉验证；老花人设解读角度清楚（开源模型成本账、部署门槛、许可风险）；读者分层明确；泛兴趣故事钩子（最强开源模型、MIT许可、1/6成本）不夸张；传播张力成立（性能 vs 成本、开源 vs 闭源、中国模型数据风险）。逻辑基本能闭环，值得进入写作框架。

GLM-5.2 以 MIT 许可开源 753B 参数 MoE 模型，在 Artificial Analysis Intelligence Index 上以 51 分领先所有开源模型，并在部分编码基准上超越 GPT-5.5，成本仅为 1/6。这直接冲击开源模型格局，影响开发者选型、部署决策和商业风险判断。

报告来源：deepseek · 可信度 85 · topic-selection-dossier-v3

这件事目前能确认什么

核心问题：GLM-5.2 开源模型的实际性能、部署成本和适用场景是否值得开发者迁移或采用？

Z.ai 于 2026 年 6 月 16 日以 MIT 许可开源 GLM-5.2 权重。
模型为 753B 总参数、40B 激活参数的 MoE 架构，文本输入，1M token 上下文窗口。
Artificial Analysis Intelligence Index 得分 51，领先 MiniMax-M3 (44)、DeepSeek V4 Pro (44)、Kimi K2.6 (43)。
在科学推理（CritPt +16, HLE +12）、编码（TerminalBench +16, SciCode +7）等多项基准上较 GLM-5.1 显著提升。
API 定价：输入 $1.4/1M tokens，输出 $4.4/1M tokens，缓存命中 $0.26/1M tokens。
自托管推荐 8x H200（vLLM FP8）或 4x H100（Q4 GGUF），社区已有 vLLM、SGLang 等推理引擎支持。
存在中国数据风险：API 使用可能受中国数据法律约束。
视觉模型 GLM-5V-Turbo 未开源。

时间线

2026-06-13: Z.ai 向 coding plan 订阅者发布 GLM-5.2
2026-06-16: Z.ai 以 MIT 许可开源 GLM-5.2 权重
2026-06-17: Artificial Analysis 发布基准报告，GLM-5.2 得分 51 领先开源模型
2026-06-17: 多家媒体报道，社区部署指南涌现

证据与依据

Simon Willison's Weblog

原始线索，概述 GLM-5.2 发布、参数、许可和初步性能

near_source · https://simonwillison.net/2026/Jun/17/glm-52/

Artificial Analysis

独立基准：GLM-5.2 得分 51，领先所有开源模型

official · https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index

Hugging Face - zai-org/GLM-5.2

官方权重仓库，MIT 许可，BF16 和 FP8 版本

official · https://huggingface.co/zai-org/GLM-5.2/tree/main

VentureBeat

GLM-5.2 在编码基准上以 1/6 成本击败 GPT-5.5

media · https://venturebeat.com/technology/z-ais-open-weights-glm-5-2-beats-gpt-5-5-on-multiple-long-horizon-coding-benchmarks-for-1-6th-the-cost

Ofox.ai

自托管硬件指南：8x H200 或 4x H100，社区引擎支持

media · https://ofox.ai/blog/glm-5-2-self-host-vllm-hardware-cost-2026/

Artificial Analysis - GLM-5.2 (max) 模型页

API 定价、速度、智能指数详细数据

official · https://artificialanalysis.ai/models/glm-5-2

TechTimes

指出 API 使用存在中国数据风险

media · https://www.techtimes.com/articles/318543/20260617/glm-52-open-weights-live-top-coding-benchmark-api-use-carries-china-data-risk.htm

CodingFleet

GLM-5.2 vs DeepSeek V4 Pro 详细基准对比

media · https://codingfleet.com/blog/glm-5-2-vs-deepseek-v4-pro/

逻辑能不能闭环

证据链完整：发布 -> 基准 -> 定价 -> 部署 -> 风险。核心问题（是否值得采用）可从性能、成本、合规三个维度回答。性能有独立基准支撑，成本有 API 和自托管两种方案，合规风险有明确提示。逻辑可闭环。

可以继续追的方向

GLM-5.2 性能与成本账：API vs 自托管的经济学分析：直接服务核心技术人和商业读者，提供可操作的决策依据
还需要：需要更详细的 API 成本对比和自托管硬件租赁价格
MIT 许可下的开源模型：GLM-5.2 的商业化风险与合规边界：针对高价值商业读者，揭示许可陷阱和数据合规问题
还需要：需要 MIT 许可在 AI 模型上的具体解释，以及中国数据法律的权威解读
GLM-5.2 部署实战：从 HuggingFace 下载到 vLLM 推理：面向入门读者和核心技术人，提供 step-by-step 指南
还需要：需要验证社区部署指南的准确性，补充常见问题
开源模型格局重塑：GLM-5.2 如何影响 DeepSeek、MiniMax 等竞品：面向行业观察者和技术决策者，分析竞争态势
还需要：需要更多竞品对比数据和市场份额信息

还缺哪些基础概念

MIT 许可在 AI 模型上的具体限制（如专利条款、数据使用）
中国数据法律对 API 使用的影响（如数据出境、审查）
MoE 架构的推理效率与密集模型的对比

还缺哪些资料素材

GLM-5.2 在 LMSYS Chatbot Arena 等更多基准上的表现
实际部署案例的成本数据（如 AWS、Lambda Labs 租赁价格）
社区反馈和已知问题（如偏见、安全漏洞）
Z.ai 的视觉模型开源计划

不能写成结论的地方

GLM-5.2 是“最强开源文本模型”，除非有多个独立基准验证
MIT 许可意味着无任何限制，需检查具体条款
1M 上下文窗口在所有场景下都有效，需验证长文本性能
所有开发者都能轻松部署，需明确硬件门槛

下一步补证检索词

GLM-5.2 在 LMSYS Chatbot Arena 上的排名和 Elo 分数
GLM-5.2 的官方技术报告或论文
GLM-5.2 的量化版本（如 4-bit、2-bit）的性能和硬件需求
Z.ai 的 GLM-5V-Turbo 视觉模型是否计划开源
MIT 许可在 AI 模型上的法律解读（如专利条款）
中国数据法律对使用中国 AI 模型 API 的具体要求

停止信号

GLM-5.2 在多个独立基准上被其他开源模型超越
Z.ai 修改许可条款或撤回开源权重
出现重大安全漏洞或合规事件
社区反馈显示部署成本远超预期或性能严重不达标

原始事实和证据入口

事实入口

confirmed_fact：Simon Willison's Weblog 发布/收录了这条原始线索：GLM-5.2 is probably the most powerful text-only open weights LLM 来源

已确认部分

标题、来源 URL、来源类型、抓取时间已记录。
该条线索来自稳定公开源，而不是强反爬论坛或截图转述。

证据入口

Simon Willison's Weblog · near_source · 原始线索和事实入口

来源优先级：P1 高质量近源

GitHub Actions 稳定抓取：True

必须知道的边界

存疑点

性能声称需独立验证

继续深挖方向

验证性能基准，对比 Llama 3、Qwen 等。

继续追官方文档、价格页、GitHub 仓库、真实用户案例或反方证据。
确认成本、门槛、合规、平台规则或岗位影响的具体边界。
把所有无证据、弱证据和推断点显式标记，等待补证后再升级结论。

懂行人可能会挑刺

不能把单条线索写成已验证机会。
不能把技术可实现直接推导为商业可赚钱。
涉及价格、收益、比例时必须继续找来源或公式。

不能写成结论

不要声称老花已经实操验证。
不要声称普通人都能复制。
不要在证据不足时给完整行动方案。

后续补证入口

这里不替你决定是否写，只保留原始来源、证据入口、存疑点和继续检索词，供个人资产系统或人工判断引用。

继续检索词：

GLM-5.2 开源：MIT 许可下最强文本模型？官方来源原始公告
GLM-5.2 开源：MIT 许可下最强文本模型？概念解释证据
GLM-5.2 开源：MIT 许可下最强文本模型？反方观点局限