← Research

Concept / Critique

一个撒手,一个掌舵

你说这俩词儿听着都挺玄,其实就一条线把它们分开:那段代码你到底看不看、认不认账。vibe coding 是把方向盘整个交给 AI,出活飞快,可你心里没底;agentic engineering 是你还攥着方向盘,让 AI 替你跑腿,但质量那条线你自己守着

vibe coding 和 agentic enginnering 有什么区别? 读时~28 min
路线图

从一条推特,走到一条分水岭

咱们先看这俩词儿是怎么冒出来的,再各自摸清楚它们到底指什么,然后停在第四站——那条把它们真正分开的线,就是你这个问题的答案;最后再看看账单和 2026 年的新走向。

核心区别 01 词的来历 两年三幕 02 vibe coding 把码交出 03 agentic 交活留码 04 分水岭 认不认账 05 账单 技术债 06 新走向 往中间靠
Roadmap. 横轴是这场讨论的展开顺序;橙色那一站(04)直接回答"区别到底在哪"。

这词儿打哪儿来

你要分清两个词,先得知道它们不是同一时间、同一个人、为同一件事造出来的。这事儿有意思的地方在于:它俩其实是同一个人在两年里说的两句话,中间隔着一整轮模型能力的升级。

第一句,2025 年 2 月。Andrej Karpathy(就是那个 OpenAI 创始成员、前特斯拉 AI 负责人)随手发了条推特,说有种新的写码方式他叫它"vibe coding"——"你彻底顺着感觉走,拥抱指数曲线,忘掉代码本身的存在"1。他自己后来都说,这就是洗澡时冒出来的一个念头,顺手一发,没想到火成这样。

第二句,差不多一年后,2026 年初。还是 Karpathy,他基本宣告 vibe coding 这个阶段"过气了",换了个新词:agentic engineering(智能体工程)7。为什么呢?因为 2025 年下半年,编码 agent 的可靠性过了一道坎——模型不光会写片段,还能拆任务、跑测试、出错了自己回头修4。能力变了,词也就得跟着变。

中间还插着第三个人的功劳。2025 年 3 月,Simon Willison(老牌开源开发者)写了篇文章,把这词儿的定义收窄了——这一刀很关键,咱们下一节细说2

25.02 Karpathy 造词 25.03 Simon 收窄定义 25.H2 agent 可靠性过坎 26.01 agentic engineering
Fig 1. 两个橙点都是 Karpathy。两个词不是对手,是同一个人在能力升级前后说的两句话。
举个原汁原味的

Karpathy 当时怎么形容自己 vibe coding 的状态?他说:"我就是看看东西、说说话、跑一跑、复制粘贴一下,然后它基本就能用了。"他还补一句:拿来做周末扔掉的小项目挺好,真出了 bug 模型修不动,那也"挺逗的"1。注意他自己定的场景就是"throwaway weekend projects"——一次性的、扔了不心疼的东西。

vibe coding:把码交出去

vibe coding 的内核,说白了就一句:你不看那段代码是怎么写的。你提需求、看结果、跑起来,行就行,不行就再让它改一遍——但你不去读它中间到底干了什么。Simon Willison 把这一点钉死了:vibe coding 的关键不是"用了 AI",而是"你接受了你没读过的代码"2

这里有个特别容易混的地方。现在满世界都在喊"我在 vibe coding",其实大部分人说的是泛义——只要用 AI 写码就叫 vibe coding。但 Karpathy 和 Simon 当初定的是个狭义的东西。这俩义项差得远,你得分清楚。

看法狭义(原版)泛义(被滥用的)
谁说的Karpathy / Simon社交媒体口水
判定标准你不读代码、不认账只要用了 AI 就算
典型场景周末小玩具、demo、原型啥都往里装
心态顺着感觉走,忘掉代码"AI 帮我写的"

为什么要较这个真?因为你拿泛义去理解,vibe coding 跟 agentic engineering 就没法比了——一个变成了"所有 AI 编程"的代名词,另一个是它的子集,这区别就糊了。咱们这篇,vibe coding 一律按狭义讲:不看码、不认账、出活快。

那它适合干啥?适合那些"对了最好、错了也无所谓"的活儿:做个一次性脚本、搭个 demo 给人看个意思、自己学着玩、快速验证一个想法行不行3。这些场景下,你要的就是速度,代码质量本来就不在考核范围里。

常见错答

"我用 Cursor / Copilot 写码,那我就是在 vibe coding。"——不对。你以为只要工具是 AI 就算,其实关键在你那只手。Simon 说得很清楚:只要你逐行读了、审了、改了 AI 生成的每段代码,那叫 AI 辅助编程,不叫 vibe coding2。工具一样,你看不看码,是两回事。

agentic engineering:交活,不交码

agentic engineering 这个词,你拆开看就懂一半:agentic 是"用智能体",engineering 是"工程"。重点在后面那个词——它强调的是,这还是工程,该有的规矩一样没少。

跟 vibe coding 最大的不一样:这里的 AI 不只是个写片段的高级自动补全。它是个能拆任务、调工具、跑测试、出错了自己回滚、一轮轮往目标逼近的执行体4。而你呢,坐在上面当架构师、当审稿人、当拍板的人。活儿交给 agent 去跑,但代码的去留、对错,你认账。

那具体怎么个干法?现在最主流的一套叫规格驱动开发(spec-driven development)。它其实是把早年软件工程"先设计后写码"那套规矩,搬到 agent 时代重新立起来5,如今连 DeepLearning.AI 都开了专门的课在教这套10。流程大概是一个环:

① 写规格 ② 生成计划 ③ agent 执行 + 跑测试 ④ 人审验收 不过则回炉
Fig 2. 规格驱动开发的环。橙色那块"人审验收"是 vibe coding 里被砍掉、agentic engineering 里被保住的一步。

关键不是外包思考,是外包执行

Karpathy 引过一句让他印象很深的话:"你可以外包你的思考,但你外包不了你的理解"4。这话是整件事的题眼。你看,agentic engineering 外包的是执行——敲键盘、改语法、跑命令这些体力活;可它不外包理解——为什么这么设计、安全有没有漏、最后对不对,这些你心里得有数。说白了,一个本来就懂质量的工程师,让 agent 替他跑腿、跑得更快,但那条质量线一点没往下掉——这就是 agentic engineering4

真正的分水岭

好,到这儿能把区别一句话说透了。Karpathy 给的那个比喻最准:vibe coding 是抬地板,agentic engineering 是抬天花板4

抬地板什么意思呢?——以前不会编程的人,现在也能做出个能跑的软件来,门槛被踩到地上了,谁都能进来玩。抬天花板是另一回事:那些本来就懂行、守着专业质量线的人,用 agent 把上限继续往上顶,做的还是经得起生产环境考验的东西。这是两个不同的目标,两种不同的人,干的不是同一份活4

维度vibe codingagentic engineering
你看码吗不看,接受没读过的代码看,代码你审你认账
外包的是思考 + 执行,全交只交执行,理解留着
你的角色提需求的人 / 看客架构师 + 审稿人 + 拍板人
出 bug 时你在猜,没模型你在 debug,心里有数
质量这条线不在考核里守住,一点不降
它干的是抬地板:谁都能做抬天花板:专业再上探
适合场景原型 / demo / 一次性脚本生产代码 / 重构 / 老库改造
失败模式能跑但是个黑箱慢,但塌方风险低

你把这张表竖着读,会发现所有差别其实都从第一行长出来——看不看码。看了,你就得理解;理解了,你就能 debug;能 debug,你才认得了账;认得了账,质量线才守得住。一环扣一环。不看码这第一步一松,后面全松。

一个能自测的问题

Karpathy 教过一个判断法,你随时能用:这个任务的产出,我能不能不靠人就验证它对不对?能,那它现在或者很快就能自动化,放心交给 agent;不能,那这一环你还得亲自盯着,判断权不能撒手4。你下次让 AI 干活之前,先拿这句话问自己一遍。

vibe coding 的账单

为什么大家这么急着从 vibe coding 转向 agentic engineering?不是赶时髦,是有人开始收到账单了。你把码交出去图一时快,这快是真快,可债也是真债——你不看的那些代码,迟早有人得回头看。

有篇 2025 年底的论文专门研究了这事儿,题目就叫《Vibe Coding in Practice》,讲的是这种写法带来的"心流"很爽,但技术债是怎么悄悄堆起来的8。业界还流传一组更扎眼的数字——我得提醒你,这组数字多是博客和厂商汇总的,不是三个独立来源都对得上,你听个量级就行,别当铁律:

账单项说法证据
安全漏洞约 45% 的 AI 生成代码带安全隐患🟡 med
代码重复重复率涨了约 48%🔴 low
重构活动重构掉了约 60%🔴 low
云账单烂 schema / 烂查询,生产规模下成本能翻到 4 倍🔴 low
测试缺口码涨得比测试快,缺口每个迭代都在拉大🟡 med

数字精确到几个百分点不必当真,但方向是站得住的:AI 写的码常常"差一点点对"——看着能跑,细看全是坑。更麻烦的是,LLM 在你不断追加约束时,经常调和不了前后矛盾,它优先听你最新那句话,而不是保持整个代码库的一致性9。这种债不爆则已,一爆就是在生产环境里爆。

反证

话说回来,vibe coding 也不是一无是处。它的证据是:在原型、demo、学习、一次性脚本这些场景里,它就是最快最爽的那个办法,Karpathy 本人都说拿来做周末项目"挺逗的"1;那篇账单论文自己也给了"可持续使用 vibe coding"的指南,并没说要一棍子打死8。本讲稿仍然倾向"分清你在干哪一个"的原因是:债不是来自 vibe coding 本身,是来自你拿着 vibe coding 去干本该 agentic engineering 的活——拿周末玩具的态度去碰生产代码,那才是塌方的起点。

2026:两条路在往中间靠

本来这俩界限挺清楚,可 2026 年有个新情况你得知道:它们正在往中间靠。Simon Willison 2026 年 5 月写了篇文章,标题就有点无奈——《vibe coding 和 agentic engineering 靠得比我想要的还近了》6

为什么会靠拢呢?因为工具在两头同时使劲。一头,Cursor 的 agent 模式、Claude Code 的计划循环、Codex 的 diff 审阅,这些都在"提需求就接受"的纯 vibe 玩法上面,硬加了一层监督;另一头,agent 越来越自动,人审那一步越来越轻。两边都朝着"中间那块"挪——又快、又有点把关6

vibe agentic 中间 地带 + 监督层 − 人工
Fig 3. 工具同时从两头改造,把两种工作流挤向同一块中间地带——但"你认不认账"这条底线没动。

但你别被"靠拢"骗了。工具长得越来越像,不等于那条根本的线消失了。哪怕用同一个 Cursor、同一个 Claude Code,你看不看那段 diff、认不认那笔账,仍然把两种人分得清清楚楚。工具收拢的是形,分水岭守的是神。

思考一下

你现在用 AI 写码,诚实问自己一句:上一段它给你的代码,你是读过才合并的,还是跑通了就合的?同一个工具,这两个答案,把你放在分水岭的两边。你站哪边?

综合判断

一句话:看不看码,认不认账

vibe coding 和 agentic engineering 的区别,归到底就一条:那段代码你看不看、认不认账。vibe coding 是 Karpathy 2025 年初造的词,指你彻底顺着感觉走、接受自己没读过的代码,图的是快,适合原型、demo、一次性脚本这些"错了也无所谓"的活儿——它抬的是地板,让谁都能做软件。agentic engineering 是他 2026 年初提的新说法,指一个懂质量的专业工程师,把执行(敲码、跑测、改语法)外包给能拆任务、跑测试、自己回滚的 agent,但理解和把关(架构、安全、对错)牢牢攥在手里——它抬的是天花板,做的是经得起生产考验的东西。所有别的差异(角色、出 bug 时是 debug 还是猜、质量线守不守得住),都从"看不看码"这第一步长出来。2026 年工具让两者形态上靠拢了,但这条底线没动。所以你别纠结用什么工具,先问自己:这段我打算认账吗?认,你在做 agentic engineering;不认,你在 vibe coding——两个都对,前提是你拿对场景。最大的坑,是拿周末玩具的态度去碰生产代码。

关键不确定性

这些地方我说实话也没全把握

  • 那组技术债数字(45% / 48% / 60% / 4 倍)我没全摸清。它们多来自博客和厂商汇总,凑不齐三个独立一手来源,方向可信,精确值你别当真。
  • "agentic engineering"是不是会沉淀成稳定术语,还不好说。这词 2026 年初才热,Karpathy 自己也承认当年 vibe coding 是随手一发,行业叫法变得快,半年后可能又换。
  • 两者"靠拢"到什么程度,目前是趋势观察,不是定论。Simon 那篇是一家之言加个人体感,有道理,但还没到行业共识那一步。
引用

Sources

  1. Andrej Karpathy — "vibe coding" 原始推特(2025.02) — https://x.com/karpathy/status/1886192184808149383
  2. Simon Willison — Not all AI-assisted programming is vibe coding(2025.03) — https://simonwillison.net/2025/Mar/19/vibe-coding/
  3. Sapkota et al. — Vibe Coding vs. Agentic Coding: Fundamentals and Practical Implications(arXiv 2505.19443) — https://arxiv.org/abs/2505.19443
  4. MindStudio — Vibe Coding vs Agentic Engineering: Karpathy's Framework — https://www.mindstudio.ai/blog/vibe-coding-vs-agentic-engineering-karpathy-framework
  5. Towards Data Science — From Vibe Coding to Spec-Driven Development — https://towardsdatascience.com/from-vibe-coding-to-spec-driven-development/
  6. Simon Willison — Vibe coding and agentic engineering are getting closer than I'd like(2026.05) — https://simonwillison.net/2026/May/6/vibe-coding-and-agentic-engineering/
  7. The New Stack — Vibe coding is passé. Karpathy has a new name for the future of software — https://thenewstack.io/vibe-coding-is-passe/
  8. Vibe Coding in Practice: Flow, Technical Debt, and Guidelines for Sustainable Use(arXiv 2512.11922) — https://arxiv.org/abs/2512.11922
  9. Amplifi Labs — The Hidden Risks of Vibe Coding and the Technical Debt It Leaves Behind — https://www.amplifilabs.com/post/the-hidden-risks-of-vibe-coding-and-the-technical-debt-it-leaves-behind
  10. DeepLearning.AI — Spec-Driven Development with Coding Agents(课程) — https://www.deeplearning.ai/courses/spec-driven-development-with-coding-agents