Vibe Coding 怨气调查:为什么 AI 写代码能跑但不敢上线?
这是不是一个值得进入写作池的选题
可选选题:质量闸提示缺口:czl-code-skill 仓库的公开内容或详细描述。
从程序员对 vibe coding 的怨气切入,讨论 AI 代码的可靠性、调试成本和上线风险,适合核心技术人和入门读者,泛兴趣读者会被“AI 写代码到底靠不靠谱”的冲突吸引。
原始线索
本文原始发布在: https://www.sunai.net/t/1407 本文使用 claude opus 4.8 协助编写 我身边不少人对 vibe coding 是有怨气的。模型已经够强了,Claude Code 这种工具也摆在面前,但他们的结论往往是:AI 写的代码不可靠,能跑但不敢上线,改一处崩三处,review 起来比自己写还累。 我自己用下来感受完全不一样。同样的模型、同样的工具,产出质量差距很大,差别基本不在模型,而在你有没有把"你这个人/你这个团队的工程判断"喂给它。大多数人把 AI 当成一个许愿池,丢一句话进去等结果;而真正能让 AI 稳定产出可上线代码的方式,是把你脑子里那套"什么叫写对了"的标准,固化成它每次都会读的东西。 这篇就讲我是怎么做的——核心是一个自己写的 code skill 。下面用的所有例子都来自我自己维护的 czl-code-skill 仓库。 一、skill 是什么,为什么要写自己的 skill 这个概念不复杂:一段带触发条件的、可被 AI 按需加载的规则文档。Claude Code (以及 Codex 、Gemini 这些支持同一套 skill-creator 标准的工具)会在合适的时机把它读进上下文,然后照着里面的规则干活。 它和你随手发给 AI 的一段 prompt 的区别在于两点:一是 持久 ,写一次,之后每个会话、每个项目都能复用,不用每次重新交代;二是 带路由 ,它不是一坨平铺的长文档,而是一个入口加一堆分领域的细则,AI 按当前任务只读相关的那部分。 那为什么要写"自己的",而不是用网上现成的规范?因为编程这件事根本没有放之四海皆准的标准。命名风格、目录结构、该不该用 go:embed 、空数据返回 null 还是空对象、Cookie 还是 localStorage 做认证——这些每个团队的答案都不一样,而且很多答案是你踩过坑才定下来的。 AI 不知道你踩过哪些坑。它的默认行为是"统计意义上最常见的写法",而最常见的写法对你的项目往往恰好是错的。我写 skill ,本质上是在做一件事: 把我脑子里那套隐性的工程判
为什么现在看:vibe coding 概念正热,但实际使用中问题频发,需要理性分析
收集原则判断:ai-frontier
选题判断
可选选题:质量闸提示缺口:czl-code-skill 仓库的公开内容或详细描述。
Vibe coding 概念正热,但实际使用中问题频发,开发者普遍反映 AI 代码能跑但不敢上线。本文从具体实践出发,提出通过 skill 固化工程判断来提升代码质量,切中当前 AI 编程工具的核心痛点:门槛降低但责任转移。
这件事目前能确认什么
核心问题:Vibe coding 生成的代码是否真的可靠,以及如何系统性地提升其可上线性?
- V2EX 用户 woodchen 发帖分享 vibe coding 经验,指出多数人抱怨 AI 代码不可靠,但问题不在模型,在于缺乏工程判断的输入。
- 作者维护了 czl-code-skill 仓库(私有),用于固化团队工程标准。
- Claude Code、Codex、Gemini 均支持 skill-creator 标准,官方文档和 GitHub 仓库可查。
- 第三方评测显示 AI 生成代码的 bug 率比人类高 1.7 倍(Shiplight AI 2025 数据),逻辑错误多 75%,安全漏洞多 2.7 倍。
- 多篇博客和媒体报道指出 vibe coding 在生产环境中失败的原因,包括缺乏上下文、调试困难、安全风险等。
时间线
- 2025-12-17 - The Register 报道 AI 生成代码 bug 率更高
- 2025-12-18 - TechRadar 报道 AI 代码问题
- 2026-04-06 - Shiplight AI 发布 1.7x bug 率数据
- 2026-06-16 - V2EX 用户 woodchen 发布 vibe coding skill 经验帖
证据与依据
V2EX 帖子
用户对 vibe coding 的怨气及 skill 方法
Claude Code 官方文档
Claude Code 支持 skill
Anthropic Skill Creator 页面
skill-creator 标准
Anthropic skills GitHub 仓库
skill-creator 标准
OpenAI Codex 官方文档
Codex 支持 skill
OpenAI skills GitHub 仓库
Codex 支持 skill
Gemini CLI 官方文档
Gemini 支持 skill
Shiplight AI 博客
AI 代码 bug 率 1.7x 更高
TechRadar 报道
AI 代码问题
The Register 报道
AI 代码 bug 更严重
SCAND 博客
vibe coding 生产环境失败原因
Justin McKelvey 博客
vibe coding 7 种失败方式
逻辑能不能闭环
逻辑基本闭环:从问题(AI 代码不可靠)到原因(缺乏工程判断)到解决方案(skill 方法)到验证(官方支持、第三方数据),但 skill 方法的效果缺乏系统性数据,且依赖个人经验。
可以继续写的方向
- Vibe coding 的怨气从何而来?:直接切入读者痛点,引发共鸣
- Skill 方法实操指南:提供可复用的解决方案,增加实用价值
- AI 代码可靠性的数据真相:用数据支撑观点,增强说服力
- Vibe coding 的风险避坑清单:帮助读者避免常见陷阱
还缺哪些基础概念
- Vibe coding 概念的定义和来源
- Skill 方法的具体编写步骤和最佳实践
- AI 代码可靠性的系统性评测数据(如不同模型、不同任务)
还缺哪些资料素材
- czl-code-skill 仓库的完整内容(作者未公开)
- 至少 2-3 个 vibe coding 正面案例
- Skill 方法在不同项目类型(如高并发、安全敏感)中的效果对比
不能写成结论的地方
- AI 写代码不可靠是普遍现象
- Skill 方法能解决所有 AI 代码质量问题
- Vibe coding 概念有明确定义
- Claude Code/Codex/Gemini 都支持同一 skill 标准(已确认支持,但标准细节需进一步验证)
下一步补证检索词
- czl-code-skill 仓库的公开部分有哪些?
- Skill-creator 标准的具体规范是什么?
- 有哪些团队成功使用 skill 方法提升 AI 代码质量?
- Vibe coding 概念最早由谁提出?
停止信号
- czl-code-skill 仓库不存在或内容与描述不符
- Skill-creator 标准并非跨平台通用
- 没有找到任何正面案例支持 skill 方法
原始事实和证据入口
给 GPT 前必须知道的边界
存疑点
- 缺乏系统性数据支撑
- 样本可能偏负面
继续深挖方向
收集更多开发者对 vibe coding 的负面反馈,分析 AI 代码的典型错误模式,对比不同工具的可靠性
- 继续追官方文档、价格页、GitHub 仓库、真实用户案例或反方证据。
- 确认成本、门槛、合规、平台规则或岗位影响的具体边界。
- 把所有无证据、弱证据和推断点显式标记,等待补证后再升级结论。
懂行人可能会挑刺
- 不能把单条线索写成已验证机会。
- 不能把技术可实现直接推导为商业可赚钱。
- 涉及价格、收益、比例时必须继续找来源或公式。
不能写成结论
- 不要声称老花已经实操验证。
- 不要声称普通人都能复制。
- 不要在证据不足时给完整行动方案。
交付给 GPT 的使用入口
后续 GPT 应用应优先读取本静态页里的选题结论、判断链路、证据入口、缺口和可写方向;如果读取 JSON,则优先读取 selection_dossier 和 material_pack。
继续检索词:
- Vibe Coding 怨气调查:为什么 AI 写代码能跑但不敢上线? 原始项目 GitHub 复盘
- Vibe Coding 怨气调查:为什么 AI 写代码能跑但不敢上线? 收入 增长 证据
- Vibe Coding 怨气调查:为什么 AI 写代码能跑但不敢上线? 失败 限制 反方证据