← Research

Playbook

做 AI 产品该补的 CS 课

你是用模型做产品的 AI engineer,不是训模型的 ML engineer——两者该学的 CS 不一样。你的重心不在训练数学,而在三块:软件工程加系统(产品的可靠、能扩、成本都压在这)、够用的 AI 理解(看懂模型怎么用,不去训它)、AI 工程与 agent 这一层(RAG、agent 模式、工具调用、evals)。下面一条本科到硕士、按这个重心排的自学课表。

我是做 AI 应用 / agent 产品的 builder(不训大模型),想系统自学 CS 理论加强 build 技能,该学 CS / EE / AI?从本科初级课学到硕士程度。 读时~24 min
路线图

从"你是哪种 builder"走到"一张按你重心排的课表"

先分清两种 AI builder,认清你是用模型做产品那种;再排出你真正该重投的三层——软件工程加系统是地基,够用的 AI 理论是中间,AI 工程与 agent 是你的核心专长;最后落成一张本科到硕士的课表。

你的核心层 01 哪种 builder 用模型,不训 02 真地基 软工+系统 03 够用理论 懂模型不训 04 核心层 AI工程·agent 05 自学课表 本科→硕士
Roadmap. 橙色那站是你真正的核心专长——AI 工程与 agent。它架在软件工程和系统这层地基上。

先分清:你是用模型的 AI engineer,不是训模型的 ML engineer

"AI builder"有两种,差别很大。ML engineer 从头训模型——数据准备、特征工程、模型选择、调优,要扎实的统计、线性代数,常常还要高学历13。AI engineer 是把现成的预训练模型集成进产品——用 API、写 prompt、搭 RAG、做 agent2🟢 high 2026 年的说法很形象:ML engineer 是算法性能的架构师,AI engineer 是把模型变成可用应用的系统集成者1

你是后者。这个角色 2023 年由 swyx 命名("Rise of the AI Engineer"),成了增长最快的技术岗之一——本质就是一个用 AI 来 build 产品的软件工程师410。门槛也低:不需要博士、不需要深厚数学,会写 Python、会用 API 就能开始做 AI 应用3🟢 high

维度ML engineer(训模型)AI engineer(做产品 · 你)
核心活从头训练、调优模型用预训练模型搭产品
要的数学重:统计、线代、最优化轻:够理解嵌入 / 检索即可
核心技能数据、特征、训练管线软件工程 + API + RAG + agent
学历门槛常要硕博会编程会用 API 就能起步
先想一下

你想做一个"帮用户整理收件箱的 agent"。这需要你会从头训练一个模型吗?为什么?先答一句再翻。

试着先答

不需要。你调用现成的 LLM(API),给它工具(读邮件、打标签、归档),配上检索和规则。难点在产品设计、工具设计、agent 编排、出错处理、成本和延迟——全是软件工程和 AI 工程的活,跟"训练一个模型"没关系。你要补的 CS,就该照这个重心来。

认清这一点:你是用模型做产品的 AI engineer,该补的 CS 重心是工程,不是训练数学。

真正的地基:软件工程 + 系统

你产品的命,压在这一层。先是软件工程基本功:够用的数据结构与算法(能写对、能估复杂度,不必刷竞赛题)、干净代码、Git、测试。再往上是对做产品最要紧的一块——系统设计:可扩展性、CAP 定理、一致性模型、缓存、SQL 与 NoSQL 的取舍、负载均衡、分布式系统的复制与分区712🟢 high 系统设计正是把算法、数据结构、网络、数据库这些底子,拧成一个真能扛用户的系统的地方7

例:demo 跑通,产品却崩了

你的客服 agent 单用户在本地跑得好好的。一上线,1000 个人同时用:LLM 调用排队超时、多轮对话的状态串了、token 成本一天烧掉几百刀、某个外部工具挂了整个 agent 卡死。这些没有一个是 prompt 问题——全是并发、状态管理、缓存、限流、容错,也就是系统问题。会搭 agent 不等于扛得住产品。

反证

有人说独立开发者做个小 app 根本用不上分布式系统。早期确实用不上——别一上来就啃 Spanner 论文。但 agent 产品只要有并发、有状态、要控成本和延迟,系统问题来得很快。所以系统设计要学,深度按你产品真实规模推进:先会单机扛住、再学水平扩展,不要反过来空学一堆用不上的。

软件工程加系统是你的真地基——产品能不能扩、稳不稳、成本控不控得住,全在这层。

够用的 AI 理论:理解模型,不训模型

这一层要学,但点到为止。你需要的是"会用、能调、能 debug"那一层理解:token 和上下文窗口是什么、嵌入向量为什么能算语义相似、检索为什么有效、temperature 这类采样参数调的是什么、什么时候用 RAG 什么时候该微调。你需要的是反向传播的推导、最优化理论、从零实现一个 Transformer 的训练。

数学也跟着轻。有了 scikit-learn、PyTorch、各家 API,你可以在不深入底层数学的前提下把东西做出来;尤其当你是模型而不是模型,数学要求低得多9🟡 med 够用的量级:一点线性代数(看懂向量、相似度)、一点概率(看懂 eval 指标),不必到训练那一级。

常见错答

"做 AI 产品,得先把机器学习数学和反向传播学透。" 不对。你不训模型,这些不是你的必修。把半年砸在啃数学上,不如花在系统设计和 agent 工程上——用模型这件事,够用的是使用层理解,不是训练层数学9。把顺序搞反,是这类自学者最大的浪费。

理解模型到"会用、能调、能 debug"就够,训练级数学不是你的必修课。

你的核心层:AI 工程与 agent

这是你区别于普通后端工程师的专长,也是该花最多力气的地方。swyx 总结的 AI 工程核心就是几样:prompt、RAG、agent、evals45。其中 agent 怎么搭,Anthropic 的《Building Effective Agents》给了最实在的一份地图:五种工作流模式,外加"工作流 vs agent"的区分6🟢 high

模式干什么什么时候用
prompt chaining把一个任务拆成几步串起来任务能清晰分解
routing先分类,再分流到专门处理输入类型差别大
parallelization并行跑多路再汇总子任务互相独立
orchestrator-workers主模型拆活、派给 worker、合结果子任务事先不固定
evaluator-optimizer一个生成、一个评分,循环改有明确评判标准
工作流 workflow 路径写死在代码里 步骤 1 步骤 2 步骤 3 agent 模型自己决定下一步 LLM 工具 循环到完成
Fig 1. Anthropic 的核心区分:工作流的步骤由代码写死、可控;agent 由模型自己决定走哪步、调哪个工具,更灵活。多数产品从工作流起步就够。

最关键的一条经验:从简单、可组合的模式起步,别一上来抱大框架。Anthropic 发现最成功的实现都不是靠复杂框架,而是直接调 LLM API、用几行代码拼出这些模式6🟢 high 再往上,工具(给 agent 用的 function)要定义清楚、省着用上下文13;evals 要会做——怎么评一条 RAG 管线、怎么量 agent 好不好,是上生产前的硬功课5。这一层正是把你从"会调 API 的人"变成"能交付 agent 产品的人"11

你来补

你做一个客服 agent:用户问题分三类——退款、技术故障、产品咨询,每类要走完全不同的处理和话术。Anthropic 五种模式里,最该先用哪个??

对答案

routing:先用一个 LLM 调用把问题分类,再分流到三套专门的 prompt / 流程。好处是关注点分离,每类能单独优化,也不会让一个万能 prompt 什么都想管、什么都管不好6。等某一类内部又出现"事先不知道要拆几步"的情况,再在那一支上叠 orchestrator-workers。

AI 工程与 agent 是你的核心专长——但从直接调 API 的简单可组合模式起步,别一上来就上重框架。

一条本科到硕士的自学课表

把前四节按重心落成一张表。注意时间分配:真地基和核心层最重,理论层最轻。"硕士程度"对你不是 ML 研究硕士,而是能像资深工程师那样做系统设计 + 熟练 AI 工程 / agent 栈 + 够用的应用 ML

阶段学什么资源怎么验证学会了
入门编程(Python)CS50 / Python 入门不看教程独立写个小工具
真地基(重)数据结构算法(够用)+ 系统设计 / 分布式 / 数据库 / 网络System Design + 分布式系统课78给自己的 agent 画一张能扛 1 万用户的架构图
够用理论(轻)嵌入 / 检索 / Transformer 概念 + 一点线代概率应用向 AI 数学科普9讲清楚 RAG 为什么能检索到对的内容
核心层(你的专长)prompt / RAG / agent 模式 / 工具 / evalsAnthropic Agents + AI 工程资料65从零做一个带 evals、能上线的 agent 产品
硕士程度(标尺)资深级系统设计 + 成熟 AI 工程栈真项目 + 复盘独立交付一个有人用、扛得住的 agent 产品

"用 AI 的方式"自学很简单:每一层都让 AI 当私教,讲概念、出题、陪你 debug,但每层留一道关掉 AI 也能过的自测关(就是上表"怎么验证"那列)。地基层别让 AI 替你跳过,卡住自己想通的那段才长本事。

先想一下

这张表里,五个阶段哪两层该花最多时间?哪层最少?

试着先答

最多:真地基(软工+系统)核心层(AI 工程/agent)——前者决定产品扛不扛得住,后者是你的专长。最少:理论层,够用就行。因为你是用模型做产品,不是训模型;时间砸在能直接提升产品的地方。

一条线:编程入门 → 软工加系统(重)→ 够用理论(轻)→ AI 工程与 agent(你的核心)→ 用真项目顶到资深工程师的系统设计水平。

综合判断

所以你到底该学什么、怎么学

回到你的问题,先纠正一个前提:不是在 CS / EE / AI 里挑专业,而是认清你是哪种 builder。你是用模型做产品的 AI engineer4,不是训模型的 ML engineer——这一刀切下去,该学的 CS 就清楚了:主体是 CS,但重心放在软件工程和系统(产品的可靠、可扩、成本都在这),EE 基本不用碰,训练级的"AI"数学也不是你的必修。怎么走:编程入门打底,软件工程加系统设计当真地基(花最多时间),够用的 AI 理论点到为止(token、嵌入、检索、采样,会用就行),然后把主力压在你的核心专长——AI 工程与 agent:prompt、RAG、Anthropic 的几种 agent 模式、工具、evals,而且从直接调 API 的简单模式起步,别迷信框架6。硕士程度的标尺,是能独立交付一个有人用、扛得住的 agent 产品。

什么时候这套要改:如果哪天你想做的不再是"用模型",而是要自己微调、训练、做模型层面的优化,那就得回头补训练数学和 ML 理论,那是另一条路。但只要你的目标是 build 应用和 agent 产品,这条以工程为重心的路,就是性价比最高的。

关键不确定性

这几处我说实话也没全把握

  • AI 工程的工具和模式变得快。RAG、agent 框架、最佳实践一年一个样,具体工具别当定论,但"软工+系统打底、AI 工程为核心、理论够用"这个重心是稳的。
  • "够用的理论"到底多够,因人而异。做纯应用拼装,数学可以很浅;但你要做高级检索、自研 eval、推理优化,需要的 ML 理解会更多。按你产品的难度往上调9
  • 系统该学多深,取决于规模。我建议"按产品真实规模推进",但具体到哪一步该学分布式一致性,没有统一答案,得看你做到多大。
自测

读完盖住,试着答这几题

  1. ML engineer 和 AI engineer 的区别是什么?你是哪种,这改变了你该学什么?

    试着先答

    ML engineer 从头训模型(要重数学、常要硕博);AI engineer 用预训练模型搭产品(会编程会用 API 就能起步)。你是 AI engineer,所以重心放软件工程+系统+AI 工程,而不是训练数学。

  2. 对 AI 应用 / agent builder,CS 的重心是哪几块?哪块最轻?

    试着先答

    重:软件工程+系统(真地基)、AI 工程与 agent(核心专长)。轻:AI 理论 / 训练数学——理解到"会用、能调、能 debug"就够。

  3. 应用题:朋友想做个 RAG 客服 agent,打算先花半年啃 ML 数学和反向传播。用本文框架劝他。

    试着先答

    他不训模型,反向传播不是必修。半年该花在:够用地懂嵌入和检索(为什么 RAG 能找到对的内容)、把软件工程和系统设计打牢、再上手 Anthropic 的 agent 模式 + evals,直接调 API 做出能跑的产品。数学够用就行,把它当主修就是把顺序搞反了。

把这几题截图,过两三天再凭记忆答一遍 —— 记得住才算真学会。

引用

Sources

  1. Vettio — AI Engineer vs ML Engineer: Demand, Salaries, and Career Growth — https://vettio.com/blog/ai-engineer-vs-ml-engineer/
  2. Howdy — AI Engineer vs ML Engineer: Roles Compared — https://www.howdy.com/blog/ai-engineer-vs-ml-engineer
  3. Zen van Riel — Generative AI Engineer vs ML Engineer(AI 工程门槛低、不必深数学) — https://zenvanriel.com/job/generative-ai-engineer-vs-ml-engineer/
  4. Latent Space(swyx)— The Rise of the AI Engineer — https://www.latent.space/p/ai-engineer
  5. Latent Space — Agent Engineering(RAG / agents / evals) — https://www.latent.space/p/agent
  6. Anthropic — Building Effective Agents(五种工作流模式 / 从简单起步) — https://www.anthropic.com/research/building-effective-agents
  7. DesignGurus — System Design Fundamentals Every Software Engineer Should Know — https://www.designgurus.io/answers/detail/system-design-fundamentals-every-software-engineer-should-know
  8. CSPrimer — Distributed Systems(课程) — https://csprimer.com/courses/distributed-systems/
  9. Coursera — What Math Do I Need to Know for AI?(用模型 vs 训模型的数学差别) — https://www.coursera.org/articles/what-math-do-i-need-to-know-for-ai
  10. swyx.io — Software 3.0 and the AI Engineer Landscape — https://www.swyx.io/ai-landscape
  11. AI Engineer — About(AI engineer 是什么 / World's Fair) — https://www.ai.engineer/about
  12. System Design Handbook — System Design: The Complete Guide — https://www.systemdesignhandbook.com/guides/system-design/
  13. Anthropic — Writing effective tools for AI agents — https://www.anthropic.com/engineering/writing-tools-for-agents