AI Builder Playbook
为判断而学,不为实现
写代码曾是理解 CS 概念的必经之路,现在实现外包给了 AI。但概念没有贬值——每个值得学的概念,背后都有一个 AI 替不了你的时刻。传统 CS 要按一个新标准重排:不懂它,你的项目会死在哪。
从断掉的旧通路,走到一张新课程表
五站。先看清旧学法断在哪、学校和市场已经怎么变,然后拿到这篇的核心工具——撞墙测试,用它把传统 CS 科目重排一遍,最后落到具体的学习动作。
旧学法断了哪一半
传统 CS 教育有一个从不明说的约定:概念靠写代码砸实。数据结构课的作业是手写链表,操作系统课的作业是写调度器。这不是仪式——写代码强迫你精确(编译器不接受含糊),给你即时后果(bug 当场爆炸)。概念和现实的碰撞发生在代码里,理解在碰撞中成形。
AI coding 把这条通路切断了。你说需求,AI 写实现,编译器对你不再说话。对指挥 AI 干活的人——本文叫 AI builder——"靠写代码逐渐把理论体系想明白"这件事,物理上不再发生。
回想你最近一次真正搞懂一个技术概念。它是从书里读懂的,还是在项目里撞懂的?
试着先答
多数人的答案是后者:项目卡住了,被迫弄懂,从此忘不掉。这个经验是第 03 节整套标准的起点——撞墙的地方才是学习发生的地方,区别只在于,旧时代撞墙发生在自己写的代码里,现在发生在 AI 交付的结果里。
但要把话说全:断的只是一半。靠写代码来懂的路径断了,"必须懂"这个要求没断,而且变得更隐蔽——因为 AI 交付的东西表面上总是体面的,你不懂,它也不报错。
有实证研究反对"不写代码也能学"。对新手程序员的实验观察发现,GenAI 会加重一部分人的元认知困难,让他们高估自己、带着能力错觉离场7 🟢 high;另一项研究里,不受限使用 AI 的组在"拿走 AI 后维护代码"的任务中失败率 77%,有教学约束的组只有 39%8 🟢 high。本文仍然认为 AI builder 不必为实现而学,因为这些实验考的都是"离开 AI 还能不能干"——那是传统工程师路线的考题,AI builder 不参加这场考试,AI 不会被拿走。但研究里那个能力错觉是普适警告:觉得自己懂了和真的懂了是两回事。第 05 节的"押预测"就是专门防它的。
断的是"靠手写来懂"的路径,没断的是"必须懂"本身。
行业已经掉头了
这不是预测,是正在发生的事。美国的 CS 院系在重写课程:降低编程语言熟练度的权重,加重概念思维、设计能力和 AI 素养1;哥伦比亚工学院明确把代码阅读与审查的比重调高2;ACM 的计算教育期刊在 2025 年发了专文讨论 GenAI 时代的 CS 教育重构3 🟢 high。方向一致:从"会写"转向"会读、会判断"。
例:哈佛 CS50——全球学的人最多的编程课——的 AI 政策很说明问题。它禁止学生用 ChatGPT 和 Copilot,却花力气自建了一个 AI 导师(CS50.ai 的"小黄鸭"),只引导提问、解释报错,被设计成"不直接给答案"45。同一门课,禁一种 AI、造另一种 AI——区别不在工具,在用法:替你做的 AI 偷走学习,引导你想的 AI 加速学习。这个区分后面第 05 节直接要用。
另一头,Karpathy 把这个时代叫 Software 3.0:自然语言成了编程接口,"英语是新的编程语言"6。这句话经常被读成"人人都会编程了",更准确的读法是:实现的门槛塌了,判断的门槛原地不动。能让 AI 写出东西的人多了,能判断写出来的东西对不对、值不值得信的人没有变多。
市场端的定价已经反映这一点。2026 年 AI 工程岗位的技能清单里,排前面的是 eval 设计、agent 编排、成本优化、可观测性——有招聘方直接说,eval 能力是区分"真做过 LLM 产品"和"只看过教程"的最大信号10 🔴 low(单源,业界说法)。对 RAG 工程师日常的描述也值得注意:大部分时间在诊断检索质量为什么掉了、权衡 chunking 和 embedding 的选择,而不是从零写代码11 🟡 med。
学校在从"会写"转向"会读、会判断";市场已经在按判断力定价。
撞墙测试:一个概念值不值得学,看它的墙
方向有了,还缺一把尺子:传统 CS 内容那么多,哪些学、学到多深?你在提问里自己给出了标准——"不掌握,会影响真实项目中的什么"。把它磨成一个可操作的测试:
假设你带着 AI 做项目,问一句:如果我完全不懂概念 X,项目会在哪一步、以什么方式死掉?
- 答不上来 → X 不用学。AI 全权代劳,它做得比你好。
- 答得上来 → 那一步就是 X 的"墙"。学到能过这堵墙的深度,一寸都不必多。
关键在于看清墙的形态。AI 把活干完了,墙不会以"做不出来"的形式出现,它以四种更阴的形式出现:
| 墙 | 撞到它的样子 | 例 |
|---|---|---|
| 物理墙 | 现实硬限制,AI 再聪明也绕不过,只能换方案 | 数据塞不进上下文窗口;延迟和账单压垮产品 |
| 判断墙 | AI 交了货,但"好不好、能不能信"没有人能替你回答 | AI 自报"准确率 96%"——出题人和考生是同一个 |
| 诊断墙 | 东西能跑但效果烂,不懂原理就指挥不动修复,越修越乱 | 检索老是找不到该找到的;agent 在简单任务上抽风 |
| 取舍墙 | 技术路线多选一,约束(预算、更新频率、隐私)在你手里,AI 只能给框架 | RAG 还是微调还是塞 prompt;贵模型还是便宜模型 |
用撞墙测试判一下:"数据库索引"对 AI builder 是哪类墙?项目会怎么死??
对答案
主要是诊断墙:产品上线后变卡,AI 说"加个索引",你得懂索引是拿空间和写入速度换查询速度、懂为什么某个查询没吃到索引,才能判断它修没修对、还是在瞎加。附带一点取舍墙:写多读少的表加不加索引,要你按业务定。不懂的死法:产品卡了,你只会对 AI 重复"再优化一下",它每次都改一点别的,三轮之后代码面目全非,卡照旧。
这个测试还有一个反向用途:它解释了为什么有些内容不必学。写一手好 prompt、调 temperature、手写正则、配置框架——这些撞不出墙,因为 AI 在这些事上比你强,而且错了立刻可见。旧课程表里它们占一半篇幅,新课程表里它们一行带过。
撞不出墙的内容放心交给 AI;撞得出墙的,才进你的课程表。
拿这把尺子重排传统 CS
逐科过一遍。每一科都拆成两层:可以交给 AI 的手写层,和必须进你脑子的判断层。Andrew Ng 的说法是 CS 基础的 70-80% 在 AI 时代仍然相关9 🟡 med(二手转述)——本文的版本更激进一点:相关的部分几乎全在判断层,手写层接近归零。
| 科目 | 交给 AI(手写层) | 你要懂(判断层) | 不懂会死在哪 |
|---|---|---|---|
| 数据结构与算法 | 手写实现、刷题 | 复杂度直觉:数据量翻十倍会怎样 | 一万条数据时正常、十万条卡死的方案,你验收不出来(诊断墙) |
| 操作系统 | 写调度器、内存管理 | 进程 / 内存 / IO 的心智模型 | AI 说"内存不够",你分不清该加机器还是改方案(诊断墙) |
| 数据库 | 手写 SQL 调优 | schema 设计、一致性、索引的代价 | 数据结构定错,后面每个功能都在为它还债(取舍墙) |
| 计算机网络 | 手撕协议栈 | 延迟、带宽、"失败是常态"的直觉 | 把跨网调用当成瞬时可靠,产品在真实网络里超时重试乱成一团(物理墙) |
| 软件工程 / 测试 | 测试框架语法 | 评估思维:怎么定义"对"、怎么防回归 | AI 自评 96%,你信了,上线翻车(判断墙)——AI 时代升值最猛的一科 |
| 安全 | 实现加密算法 | 威胁建模直觉:一切输入不可信 | prompt injection 时代,AI 本身成了新攻击面,你想不到要防(判断墙) |
| 编程语言 | 语法、惯用法,几乎全部 | 读代码的能力——这是审 AI 产出的底线 | 完全看不懂 AI 写了什么,连"它跑偏了"都发现不了 |
"AI 时代不用学算法了。"错在哪:把"不用会写"听成了"不用懂"。你确实一辈子不用再写快排;但"这个方案在数据量大十倍时还成立吗"是你每周都要做的验收判断,没有复杂度直觉,这个判断做不了——AI 不会主动告诉你它给的方案是 O(n²),因为在演示数据上它跑得好好的。
每一科都没死,死的是它们的手写层;活下来的全是判断层。
学的动作:四个,全部长在项目里
课程表有了,最后是怎么学。不是开一门课从头听,是四个动作,全部嵌在你本来就在做的项目里。
① 撞墙时学,不预修
不要在项目开始前把"可能用到的概念"学一遍——学了留不住,因为没有挂靠点。等真实项目撞上墙(AI 交付的东西不可信了、效果烂了、要拍板了),在那个瞬间学:动机最强,语境最全,学完立刻用上。
② AI 当导师,但用 CS50 式用法
撞墙后让 AI 教你,但记住第 02 节那个区分:替你总结的 AI 偷走学习,引导你想的 AI 加速学习。操作上就两条:追问到你能用自己的话把概念讲清;然后让 AI 出一个变体场景反过来考你。十几分钟,够过墙就停。
③ 押预测,再开奖
这是防能力错觉的(第 01 节那两项研究的教训)。AI 动手前,先押一句:"我觉得结果会是 X / 会在 Y 翻车。"然后让现实开奖。押对了,概念是真懂了;押错了,错的地方就是下一个该学的概念。预测必须在看到结果之前说出口——事后觉得"我早知道"不算数,那正是错觉的形状。
④ 学习的存档形式:指令和验收标准
传统学习的产出是笔记,AI builder 学习的产出是你对 AI 说的话变了。学懂一个概念,落点是一条新的指令习惯或验收动作,下个项目自动带上。笔记会忘,指令习惯不会——它每天都在被使用。
例:完整走一遍这四个动作。你让 AI 把五千条用户数据的城市字段规范化,AI 几分钟报告"完成,抽样自查准确率 96%"。押预测:这个 96% 可信吗?——你押"可信",开奖:不可信,自查用的是生成答案的同一套逻辑,出题人在考自己,这是判断墙。撞墙时学:花十分钟学评估的最小概念——金标准,一小批独立于 AI、以你的标准为准的正确答案。CS50 式追问:让 AI 出个变体考你——"如果让另一个 AI 来打分呢?"(还是不行,除非它和被测的不是同一来源,且标准是你定的。)存档:下次你的指令直接变成"金标准我来标 20 条,跑完用它算真实准确率"。这一关从撞墙到存档,半小时,这就是一"课"。
学没学会,看你对 AI 说的话变没变。
所以,现在的人该怎么学传统 CS
直接回答:目标换掉,内容重筛,方法换轨。目标——为判断而学,不为实现;"会写"不再是学会的标志,"会验收、会诊断、会拍板"才是。内容——用撞墙测试筛:答不出"不懂它项目死在哪"的概念直接跳过,答得出的学到能过墙为止;按这个标准,评估、安全、复杂度直觉大幅升值,语法和手写实现归零。方法——不开课、不预修,四个动作长在项目里:撞墙时学、CS50 式追问、押预测防错觉、学完落成新的指令习惯。
这套打法什么时候不成立:你要做模型层、性能关键或安全关键的系统——那些领域手写层还活着,得按老路子学;你的目标是成为传统意义上的工程师——研究明确显示新手期过度依赖 AI 有害78;最后,它赌了"AI 始终在场"——如果你的工作环境会拿走 AI(面试、断网、合规限制),这套路线培养的能力会露底。认清赌注,再上桌。
这些地方我说实话也没全把握
- "撞墙测试"和"四类墙"是本文提出的组织框架,不是经过研究验证的教学法。它与 need-to-know、问题驱动学习的文献方向一致,但"按墙筛内容恰好筛出该学的"这个强主张,目前只有逻辑自洽,没有实证。
- "eval 能力是招聘最大信号"来自单一招聘方的说法,行业共识程度未知。方向(评估升值)有多源支持,幅度存疑。
- Andrew Ng"70-80% 基础仍相关"是二手转述,原始出处和语境没有核到。
- AI builder 这条路线本身有多稳,取决于 AI 能力和价格的走向——这超出任何人能验证的范围。
读完盖住,试着答这几题
撞墙测试的那句问话是什么?
试着先答
"如果我完全不懂概念 X,项目会在哪一步、以什么方式死掉?"答不上来就不学,答得上来就学到能过墙。
四类墙分别是什么?各举一个例子。
试着先答
物理墙(上下文塞不下)、判断墙(AI 自评 96% 信不信)、诊断墙(检索效果烂往哪修)、取舍墙(RAG 还是微调)。
应用:"正则表达式"该学到什么程度?
试着先答
过不了撞墙测试:AI 写正则比你好,错了当场可见,项目不会因为你不懂正则语法而死。知道"它是模式匹配、能干什么"即可。验收 AI 写的正则靠给测试用例——那是评估那一课的事,不是正则的。
应用:AI 报告"任务完成,自查通过",你的第一反应该是什么?
试着先答
出题人和考生是同一个,自查分数不构成证据。要求独立验收:金标准、抽查、或换一个不同来源的评估者,标准由你定。
应用:你的产品用户从一千涨到十万,按四类墙的框架,哪几堵最先撞?
试着先答
物理墙先到(数据量、延迟、账单),诊断墙紧跟(一千条时"能跑"的方案在十万条时效果或性能塌掉,你得定位是哪一环)。这正是复杂度直觉和成本结构两课的用武之地。
把这几题截图,过两三天再凭记忆答一遍 —— 记得住才算真学会。
主张-证据速查
| 主张 | 支持源 | 证据等级 |
|---|---|---|
| 大学 CS 课程正转向代码阅读、概念与 AI 素养 | [1][2][3] | 🟢 |
| 新手依赖 AI 会产生能力错觉;移除 AI 后表现大幅下降 | [7][8] | 🟢 |
| CS50 禁商业 AI、自建引导式 AI 导师 | [4][5] | 🟢 |
| eval 能力是 AI 工程招聘的最强信号 | [10] | 🔴 |
| CS 基础 70-80% 仍相关(Ng) | [9] | 🟡 |
Sources
- Universities are rethinking computer science curriculum in response to AI tools — TechSpot — techspot.com
- Adapting Computer Science Education to a Changing Tech Landscape — Columbia Engineering — engineering.columbia.edu
- Rethinking Computer Science Education in the Age of GenAI — ACM Transactions on Computing Education — dl.acm.org
- CS50 Will Integrate Artificial Intelligence Into Course Instruction — The Harvard Crimson — thecrimson.com
- Artificial Intelligence — CS50x 2026 课程说明(AI 使用政策与 CS50.ai)— cs50.harvard.edu
- Andrej Karpathy: Software Is Changing (Again) — Y Combinator AI Startup School — ycombinator.com
- The Widening Gap: The Benefits and Harms of Generative AI for Novice Programmers — arXiv:2405.17739 (ICER) — arxiv.org
- Mitigating "Epistemic Debt" in Generative AI-Scaffolded Novice Programming using Metacognitive Scripts — arXiv:2602.20206 — arxiv.org
- Data Structures and Algorithms in 2026(含 Andrew Ng 转述)— Nucamp — nucamp.co
- AI Developer Hiring 2026: Skills That Actually Matter — Digital Applied — digitalapplied.com
- How to Hire RAG Engineers in 2026 — KORE1 — kore1.com