Concept / Critique
一个撒手,一个掌舵
你说这俩词儿听着都挺玄,其实就一条线把它们分开:那段代码你到底看不看、认不认账。vibe coding 是把方向盘整个交给 AI,出活飞快,可你心里没底;agentic engineering 是你还攥着方向盘,让 AI 替你跑腿,但质量那条线你自己守着。
从一条推特,走到一条分水岭
咱们先看这俩词儿是怎么冒出来的,再各自摸清楚它们到底指什么,然后停在第四站——那条把它们真正分开的线,就是你这个问题的答案;最后再看看账单和 2026 年的新走向。
这词儿打哪儿来
你要分清两个词,先得知道它们不是同一时间、同一个人、为同一件事造出来的。这事儿有意思的地方在于:它俩其实是同一个人在两年里说的两句话,中间隔着一整轮模型能力的升级。
第一句,2025 年 2 月。Andrej Karpathy(就是那个 OpenAI 创始成员、前特斯拉 AI 负责人)随手发了条推特,说有种新的写码方式他叫它"vibe coding"——"你彻底顺着感觉走,拥抱指数曲线,忘掉代码本身的存在"1。他自己后来都说,这就是洗澡时冒出来的一个念头,顺手一发,没想到火成这样。
第二句,差不多一年后,2026 年初。还是 Karpathy,他基本宣告 vibe coding 这个阶段"过气了",换了个新词:agentic engineering(智能体工程)7。为什么呢?因为 2025 年下半年,编码 agent 的可靠性过了一道坎——模型不光会写片段,还能拆任务、跑测试、出错了自己回头修4。能力变了,词也就得跟着变。
中间还插着第三个人的功劳。2025 年 3 月,Simon Willison(老牌开源开发者)写了篇文章,把这词儿的定义收窄了——这一刀很关键,咱们下一节细说2。
Karpathy 当时怎么形容自己 vibe coding 的状态?他说:"我就是看看东西、说说话、跑一跑、复制粘贴一下,然后它基本就能用了。"他还补一句:拿来做周末扔掉的小项目挺好,真出了 bug 模型修不动,那也"挺逗的"1。注意他自己定的场景就是"throwaway weekend projects"——一次性的、扔了不心疼的东西。
vibe coding:把码交出去
vibe coding 的内核,说白了就一句:你不看那段代码是怎么写的。你提需求、看结果、跑起来,行就行,不行就再让它改一遍——但你不去读它中间到底干了什么。Simon Willison 把这一点钉死了:vibe coding 的关键不是"用了 AI",而是"你接受了你没读过的代码"2。
这里有个特别容易混的地方。现在满世界都在喊"我在 vibe coding",其实大部分人说的是泛义——只要用 AI 写码就叫 vibe coding。但 Karpathy 和 Simon 当初定的是个狭义的东西。这俩义项差得远,你得分清楚。
| 看法 | 狭义(原版) | 泛义(被滥用的) |
|---|---|---|
| 谁说的 | Karpathy / Simon | 社交媒体口水 |
| 判定标准 | 你不读代码、不认账 | 只要用了 AI 就算 |
| 典型场景 | 周末小玩具、demo、原型 | 啥都往里装 |
| 心态 | 顺着感觉走,忘掉代码 | "AI 帮我写的" |
为什么要较这个真?因为你拿泛义去理解,vibe coding 跟 agentic engineering 就没法比了——一个变成了"所有 AI 编程"的代名词,另一个是它的子集,这区别就糊了。咱们这篇,vibe coding 一律按狭义讲:不看码、不认账、出活快。
那它适合干啥?适合那些"对了最好、错了也无所谓"的活儿:做个一次性脚本、搭个 demo 给人看个意思、自己学着玩、快速验证一个想法行不行3。这些场景下,你要的就是速度,代码质量本来就不在考核范围里。
"我用 Cursor / Copilot 写码,那我就是在 vibe coding。"——不对。你以为只要工具是 AI 就算,其实关键在你那只手。Simon 说得很清楚:只要你逐行读了、审了、改了 AI 生成的每段代码,那叫 AI 辅助编程,不叫 vibe coding2。工具一样,你看不看码,是两回事。
agentic engineering:交活,不交码
agentic engineering 这个词,你拆开看就懂一半:agentic 是"用智能体",engineering 是"工程"。重点在后面那个词——它强调的是,这还是工程,该有的规矩一样没少。
跟 vibe coding 最大的不一样:这里的 AI 不只是个写片段的高级自动补全。它是个能拆任务、调工具、跑测试、出错了自己回滚、一轮轮往目标逼近的执行体4。而你呢,坐在上面当架构师、当审稿人、当拍板的人。活儿交给 agent 去跑,但代码的去留、对错,你认账。
那具体怎么个干法?现在最主流的一套叫规格驱动开发(spec-driven development)。它其实是把早年软件工程"先设计后写码"那套规矩,搬到 agent 时代重新立起来5,如今连 DeepLearning.AI 都开了专门的课在教这套10。流程大概是一个环:
关键不是外包思考,是外包执行
Karpathy 引过一句让他印象很深的话:"你可以外包你的思考,但你外包不了你的理解"4。这话是整件事的题眼。你看,agentic engineering 外包的是执行——敲键盘、改语法、跑命令这些体力活;可它不外包理解——为什么这么设计、安全有没有漏、最后对不对,这些你心里得有数。说白了,一个本来就懂质量的工程师,让 agent 替他跑腿、跑得更快,但那条质量线一点没往下掉——这就是 agentic engineering4。
真正的分水岭
好,到这儿能把区别一句话说透了。Karpathy 给的那个比喻最准:vibe coding 是抬地板,agentic engineering 是抬天花板4。
抬地板什么意思呢?——以前不会编程的人,现在也能做出个能跑的软件来,门槛被踩到地上了,谁都能进来玩。抬天花板是另一回事:那些本来就懂行、守着专业质量线的人,用 agent 把上限继续往上顶,做的还是经得起生产环境考验的东西。这是两个不同的目标,两种不同的人,干的不是同一份活4。
| 维度 | vibe coding | agentic engineering |
|---|---|---|
| 你看码吗 | 不看,接受没读过的代码 | 看,代码你审你认账 |
| 外包的是 | 思考 + 执行,全交 | 只交执行,理解留着 |
| 你的角色 | 提需求的人 / 看客 | 架构师 + 审稿人 + 拍板人 |
| 出 bug 时 | 你在猜,没模型 | 你在 debug,心里有数 |
| 质量这条线 | 不在考核里 | 守住,一点不降 |
| 它干的是 | 抬地板:谁都能做 | 抬天花板:专业再上探 |
| 适合场景 | 原型 / demo / 一次性脚本 | 生产代码 / 重构 / 老库改造 |
| 失败模式 | 能跑但是个黑箱 | 慢,但塌方风险低 |
你把这张表竖着读,会发现所有差别其实都从第一行长出来——看不看码。看了,你就得理解;理解了,你就能 debug;能 debug,你才认得了账;认得了账,质量线才守得住。一环扣一环。不看码这第一步一松,后面全松。
Karpathy 教过一个判断法,你随时能用:这个任务的产出,我能不能不靠人就验证它对不对?能,那它现在或者很快就能自动化,放心交给 agent;不能,那这一环你还得亲自盯着,判断权不能撒手4。你下次让 AI 干活之前,先拿这句话问自己一遍。
vibe coding 的账单
为什么大家这么急着从 vibe coding 转向 agentic engineering?不是赶时髦,是有人开始收到账单了。你把码交出去图一时快,这快是真快,可债也是真债——你不看的那些代码,迟早有人得回头看。
有篇 2025 年底的论文专门研究了这事儿,题目就叫《Vibe Coding in Practice》,讲的是这种写法带来的"心流"很爽,但技术债是怎么悄悄堆起来的8。业界还流传一组更扎眼的数字——我得提醒你,这组数字多是博客和厂商汇总的,不是三个独立来源都对得上,你听个量级就行,别当铁律:
| 账单项 | 说法 | 证据 |
|---|---|---|
| 安全漏洞 | 约 45% 的 AI 生成代码带安全隐患 | 🟡 med |
| 代码重复 | 重复率涨了约 48% | 🔴 low |
| 重构活动 | 重构掉了约 60% | 🔴 low |
| 云账单 | 烂 schema / 烂查询,生产规模下成本能翻到 4 倍 | 🔴 low |
| 测试缺口 | 码涨得比测试快,缺口每个迭代都在拉大 | 🟡 med |
数字精确到几个百分点不必当真,但方向是站得住的:AI 写的码常常"差一点点对"——看着能跑,细看全是坑。更麻烦的是,LLM 在你不断追加约束时,经常调和不了前后矛盾,它优先听你最新那句话,而不是保持整个代码库的一致性9。这种债不爆则已,一爆就是在生产环境里爆。
2026:两条路在往中间靠
本来这俩界限挺清楚,可 2026 年有个新情况你得知道:它们正在往中间靠。Simon Willison 2026 年 5 月写了篇文章,标题就有点无奈——《vibe coding 和 agentic engineering 靠得比我想要的还近了》6。
为什么会靠拢呢?因为工具在两头同时使劲。一头,Cursor 的 agent 模式、Claude Code 的计划循环、Codex 的 diff 审阅,这些都在"提需求就接受"的纯 vibe 玩法上面,硬加了一层监督;另一头,agent 越来越自动,人审那一步越来越轻。两边都朝着"中间那块"挪——又快、又有点把关6。
但你别被"靠拢"骗了。工具长得越来越像,不等于那条根本的线消失了。哪怕用同一个 Cursor、同一个 Claude Code,你看不看那段 diff、认不认那笔账,仍然把两种人分得清清楚楚。工具收拢的是形,分水岭守的是神。
你现在用 AI 写码,诚实问自己一句:上一段它给你的代码,你是读过才合并的,还是跑通了就合的?同一个工具,这两个答案,把你放在分水岭的两边。你站哪边?
一句话:看不看码,认不认账
vibe coding 和 agentic engineering 的区别,归到底就一条:那段代码你看不看、认不认账。vibe coding 是 Karpathy 2025 年初造的词,指你彻底顺着感觉走、接受自己没读过的代码,图的是快,适合原型、demo、一次性脚本这些"错了也无所谓"的活儿——它抬的是地板,让谁都能做软件。agentic engineering 是他 2026 年初提的新说法,指一个懂质量的专业工程师,把执行(敲码、跑测、改语法)外包给能拆任务、跑测试、自己回滚的 agent,但理解和把关(架构、安全、对错)牢牢攥在手里——它抬的是天花板,做的是经得起生产考验的东西。所有别的差异(角色、出 bug 时是 debug 还是猜、质量线守不守得住),都从"看不看码"这第一步长出来。2026 年工具让两者形态上靠拢了,但这条底线没动。所以你别纠结用什么工具,先问自己:这段我打算认账吗?认,你在做 agentic engineering;不认,你在 vibe coding——两个都对,前提是你拿对场景。最大的坑,是拿周末玩具的态度去碰生产代码。
这些地方我说实话也没全把握
- 那组技术债数字(45% / 48% / 60% / 4 倍)我没全摸清。它们多来自博客和厂商汇总,凑不齐三个独立一手来源,方向可信,精确值你别当真。
- "agentic engineering"是不是会沉淀成稳定术语,还不好说。这词 2026 年初才热,Karpathy 自己也承认当年 vibe coding 是随手一发,行业叫法变得快,半年后可能又换。
- 两者"靠拢"到什么程度,目前是趋势观察,不是定论。Simon 那篇是一家之言加个人体感,有道理,但还没到行业共识那一步。
Sources
- Andrej Karpathy — "vibe coding" 原始推特(2025.02) — https://x.com/karpathy/status/1886192184808149383
- Simon Willison — Not all AI-assisted programming is vibe coding(2025.03) — https://simonwillison.net/2025/Mar/19/vibe-coding/
- Sapkota et al. — Vibe Coding vs. Agentic Coding: Fundamentals and Practical Implications(arXiv 2505.19443) — https://arxiv.org/abs/2505.19443
- MindStudio — Vibe Coding vs Agentic Engineering: Karpathy's Framework — https://www.mindstudio.ai/blog/vibe-coding-vs-agentic-engineering-karpathy-framework
- Towards Data Science — From Vibe Coding to Spec-Driven Development — https://towardsdatascience.com/from-vibe-coding-to-spec-driven-development/
- Simon Willison — Vibe coding and agentic engineering are getting closer than I'd like(2026.05) — https://simonwillison.net/2026/May/6/vibe-coding-and-agentic-engineering/
- The New Stack — Vibe coding is passé. Karpathy has a new name for the future of software — https://thenewstack.io/vibe-coding-is-passe/
- Vibe Coding in Practice: Flow, Technical Debt, and Guidelines for Sustainable Use(arXiv 2512.11922) — https://arxiv.org/abs/2512.11922
- Amplifi Labs — The Hidden Risks of Vibe Coding and the Technical Debt It Leaves Behind — https://www.amplifilabs.com/post/the-hidden-risks-of-vibe-coding-and-the-technical-debt-it-leaves-behind
- DeepLearning.AI — Spec-Driven Development with Coding Agents(课程) — https://www.deeplearning.ai/courses/spec-driven-development-with-coding-agents