← Research

概念 · 一词两义

知识图谱不是知识体系

你说"知识图谱"这词儿,其实指着两个不一样的东西。一个是正经技术术语——给机器读的、由"实体 + 关系"连成的一张网,你搜"乔布斯"时右边那张卡片就是它喂出来的;另一个是借了这词的比喻——你在 Obsidian、Roam 里搭的那张笔记连线图,也就是大家常说的"个人知识体系"。同样是点和线,但根上是两码事。

什么是知识图谱?这是在说个人的知识图谱知识体系吗 读时~25 min
路线图

一个词,绊倒两拨人

咱们这么走:先看这词怎么被两拨人抢着用,再把"正经那版"拆开看它到底是什么、在哪儿干活,然后回头看你说的"个人知识图谱"是怎么回事——最后一站直接回答你那句"是不是在说个人知识体系"。

直接回答 01 一词两用 谁在说 02 机器的网 实体+关系 03 哪儿干活 搜索·推荐 04 你的网 笔记连线 05 同形不同质 两者辨析
Roadmap. 横轴是从"困惑"走到"分清";橙色那站直接回答你的原问题。

一个词,两拨人在用

你听到"知识图谱"会犯嘀咕,这事儿一点不怪你——因为有两拨人,嘴里说着同一个词,心里想的是两样东西。

一拨是搞技术的。他们说的"知识图谱"(英文 Knowledge Graph),是个有出处、有定义的正经术语。这词大规模火起来,是 Google 带的头:2012 年 5 月 16 日,Google 正式推出一个叫 Knowledge Graph 的东西,一句口号说得特别到位——"是东西,不是字符串"(things, not strings)2。意思是,搜索引擎以前只会匹配字面,你搜"乔布斯"它就找含"乔布斯"三个字的网页;有了知识图谱之后,它知道乔布斯是个、创办过苹果、生于 1955 年——它脑子里有了"乔布斯"这个实体本身,而不只是这仨字。

另一拨是搞个人成长、做笔记、聊"知识管理"的。他们说"我要搭建自己的知识图谱""把零散知识连成体系",指的是另一回事:把自己脑子里、笔记里的东西连成一张网,看清它们之间的关联。这层意思下,"知识图谱"基本等于"个人知识体系"——一个比喻,一种理想状态。

先想一下

"知识图谱"这个词第一次大规模流行,主要是被谁带火的?是哪一年的事?先在脑子里答一下,别往下翻。

试着先答

Google,2012 年 5 月。Google 推出 Knowledge Graph 之后,这词才从学术圈走进大众视野,"things, not strings" 成了它的标志性口号2。在那之前,"知识图谱 / knowledge graph"更多是语义网(Semantic Web)圈子里的研究术语。

所以这篇接下来干的事很简单:把"正经那版"先讲透——它是什么、怎么搭、在哪儿用;再回头看"个人那版"到底是不是一码事。记住一句话就行:同一个词,一个指机器用的数据结构,一个指你自己用的思考方法。

机器读的那张网

先说正经版。一句话:知识图谱就是把现实世界里的"东西"和它们之间的"关系",连成一张机器能读、能查、还能推理的网。1 网上的点(节点)是一个个实体——人、地方、公司、概念、事件都算;点跟点之间的线(边)就是关系。

最小的那块积木:三元组

这张网是怎么搭起来的?靠一种特别朴素的小积木,叫三元组(triple):主语—谓语—宾语,三个一组4。比如:

  • 乔布斯 —— 创办了 —— 苹果公司
  • 苹果公司 —— 总部在 —— 库比蒂诺
  • 乔布斯 —— 出生于 —— 1955 年

每一条三元组,就是网上的一条边:从一个实体,顺着一种关系,指向另一个实体。你把成千上万条这样的小三元组摞在一起,一张大网就长出来了。这套写法有个正式底子,叫 RDF(资源描述框架),它的结构天生就跟"点—边—点"对得上,所以特别适合拿来盛知识图谱4

乔布斯 实体 / 主语 创办了 关系 / 谓语 苹果公司 实体 / 宾语
Fig 1. 一条三元组 = 网上的一条边。无数条这样的边摞起来,就是一张知识图谱。

还有个看不见的"规矩":本体

光有三元组还不够。这张网背后通常还有一套本体(ontology),你可以理解成这张网的"规矩"或者"数据模板"3。它管啥呢?它划下道道——世上有哪些(人、公司、城市……),哪些关系说得通:人能"创办"公司,可公司不能"出生",对吧。有了这套规矩,机器才能干一件关键的事——推理。比如你只告诉它"乔布斯创办苹果""苹果总部在库比蒂诺",它能自己推出"乔布斯创办的公司总部在库比蒂诺",哪怕你从没直接写过这句。这就是知识图谱比"一堆表格"高级的地方。

你来补

照着三元组的写法,把下面这句补完整。已知一个事实:达·芬奇画了《蒙娜丽莎》。写成三元组就是——

达·芬奇 —— ? —— 《蒙娜丽莎》

对答案

中间填的是关系(谓语),比如"创作了 / 画了"。所以是:达·芬奇 —— 创作了 —— 《蒙娜丽莎》。注意,两头是实体(一个人、一幅画),中间永远是关系。你能把任何一个事实拆成这种"实体—关系—实体"的小块,你就摸到知识图谱的命门了。

规模上给你个数:Google 的知识图谱 2012 年刚出来就有 5 亿多个实体;到 2020 年,已经是 50 亿个实体、5000 亿条事实2所以正经版的知识图谱,本质是一套给机器用的、带规矩的、能自动推理的数据结构——不是一张给人看的示意图。

它在哪儿真干活

讲这么多定义,这玩意儿到底用在哪?你其实天天在用,只是没察觉。

举个具体的

你在 Google 搜"达·芬奇",右边会蹦出来一张卡片:照片、生卒年、代表作、国籍……这张卡片(叫 Knowledge Panel)不是从某一个网页上抓的一段话,而是从知识图谱里把"达·芬奇"这个实体连着的一圈关系——出生地、职业、画过哪些画——现取现拼出来的5。这就是"things, not strings"落地的样子。

除了搜索,常见的还有这么几摊:

  • 推荐:像亚马逊这种,把商品、属性、你的行为、评价全连成一张图,顺着关系给你推"买了这个的人还买了那个"6
  • 问答 / 语音助手:Siri、Alexa 这些,背后都靠知识图谱当"事实底座",你问"姚明多高",它顺着图谱里"姚明—身高—226cm"这条边直接给你答案6
  • 企业里:金融做反欺诈、风控,把账户、交易、设备连成图找异常;医疗、电商、社交也都在用5

现在最热的一摊:给大模型当"事实底子"

2024 年以后,知识图谱又火了一把,因为它跟大语言模型(LLM)凑成了一对儿,叫 GraphRAG。逻辑是这样:大模型爱"一本正经地胡说"(幻觉),那就给它接一张知识图谱,回答之前先去图谱里捞结构化的事实当依据,把话"摁"在事实上,少瞎编7

不过得说句实在的:这事儿没那么神。研究发现,大模型读图谱里那种零散的三元组也会犯迷糊、照样能产生跟事实对不上的幻觉7 🟡 med。所以知识图谱给大模型"压幻觉"是个真方向,但不是一摁就灵的银弹,2024–2025 还有一堆论文在专门治这个。记住:知识图谱真正的价值,是给机器提供一份"结构化、可追溯、能推理"的事实底子——搜索、推荐、问答、压模型幻觉,全是这一个底子的不同用法。

你脑子里那张网

好,正经版讲完了。现在回到你那句"是不是在说个人的知识体系"——说的就是这一拨人嘴里的"知识图谱"。

这拨人指的,是 个人知识管理(PKM):用 Obsidian、Roam、Logseq 这类笔记软件,把自己的笔记一条条连起来。这些软件有个招牌功能,叫 graph view(关系图视图)——它把你所有笔记画成一堆小圆点,笔记之间有双向链接的就连根线,满屏星星点点连成一张网9。你一看,"嚯,这不就是我的知识图谱嘛"——名字就是这么借过来的。

它的祖师爷:卡片盒

这套玩法不是软件发明的,根子在一个老方法——卡片盒笔记法(Zettelkasten),德国社会学家卢曼搞出来的:把知识拆成一张张"原子笔记"(一张只写一个想法),每张编个号,笔记之间靠编号互相引用,慢慢织成一张想法的网8。Obsidian 干的事,说白了就是卢曼的卡片盒——只不过那些手抄的交叉引用,现在变成了能点的链接,那张网还能自动画出来给你看9

它图个啥?图的是"想法之间长出意外的连接"。知识本来就不是树状的——一个点子常常同时属于三个主题。你今天记的读书笔记,跟半年前记的一个工作教训挂上了钩,这种你自己都没料到的关联,就是个人知识网最值钱的地方8

常见错答

"我在 Obsidian 里搭了个知识图谱"——这话里的"知识图谱",跟 Google 那个不是一个东西。Obsidian 那张 graph view,只是把你的笔记双链画出来给你看,图里那些线没有"含义":机器不知道这条线是"反驳"还是"举例"还是"作者是"。它没有本体、没有 schema,机器读不懂里头的语义,更谈不上自动推理。它好看、好用、对你想问题有帮助——但它是给你这个人看的可视化,不是给机器推理的数据结构。把这俩当成一回事,是最常见的误会。

所以"个人知识图谱",本质是一种思考和整理的方法——靠你自己手动连线、自然生长,图的是看清关联、激发新想法,而不是让机器去查去推。

同形不同质:到底什么关系

两边都讲完了,现在正面回答你:它俩同形,但不同质。都是"点和线连成的网"这个长相(同形),可往根上一刨,是两种东西(不同质)。一张表给你摆清楚:

维度知识图谱(正经术语)个人知识图谱(比喻)
给谁用给机器给你自己
核心单位三元组(实体-关系-实体)一条笔记 / 一个想法
有没有规矩(schema/本体)有,关系都有定义基本没有,随手连
谁来建工程和算法批量抽取你一条条手写、手连
机器能推理吗能 —— 这是重点不能,只是把链接画出来
典型代表Google 知识图谱、企业图谱Obsidian、Roam、卡片盒

最关键的一行是"机器能推理吗"。正经知识图谱存在的全部意义,就是让机器能、能;个人那张网,机器既不查也不推,它纯粹是帮你这个肉脑子看清自己脑子里的关联。一个是数据结构,一个是思考方法——这就是"不同质"的根。

反证

话别说太死:"个人知识图谱"也不全是乱叫。现在有人真在 Obsidian 里给笔记加结构化属性(properties)、用 Dataview 查询,甚至装插件接 RDF——那就是在往正经知识图谱那头靠了。所以这俩与其说是"非黑即白",不如说是一条光谱:从"纯给人看的笔记连线",到"带 schema、能被查询推理的形式化图谱",中间是连续的。本篇仍坚持把它俩分开讲,是因为在默认语境下,"知识图谱"作为一个正式术语,指的就是机器那一头;把它跟"做笔记搭体系"直接划等号,会让你误以为搭个人体系也得懂 RDF、本体那套重家伙——其实完全不用。

一个能随身带走的判断动作:下回听到"知识图谱",先反问一句——"你说的是 Google 那种,还是 Obsidian 那种?"问清楚了,90% 的误会当场化解。

综合判断

回到你的原问题

严格讲,不是。"知识图谱"作为一个正式技术术语,指的是给机器读的、由实体和关系连成的网络——它有形式化的规矩(本体)、能被查询、最关键是能做自动推理,Google 2012 年带火了它,如今撑着搜索卡片、推荐、语音问答,还被拿去给大模型当"事实底子"压幻觉。你说的"个人的知识图谱 / 知识体系",是借了这个词的比喻:指 Obsidian、Roam、卡片盒那种把自己笔记连成网的玩法——同样是点和线,但没有 schema、不做机器推理,是给你自己想问题、看关联用的。

所以一个是数据结构,一个是思考方法,撞了同一个名字而已。给你两条实用的:其一,听到这词先确认对方说的是哪种,别自己在心里对错暗号;其二,你要是想"搭建自己的知识体系",放心,用 Obsidian、好好做卡片盒就够了,跟正经知识图谱里那套 RDF、本体、三元组是两件事,别被术语唬住、绕进不必要的技术坑里。

自测

读完盖住,试着答这几题

  1. 正经知识图谱的最小积木"三元组",是哪三个部分?

    试着先答

    主语—谓语—宾语,也就是"实体—关系—实体"。比如"乔布斯—创办—苹果"。一条三元组就是图上的一条边。

  2. 正经知识图谱和"个人知识图谱",最本质的一条区别是什么?

    试着先答

    有没有形式化的规矩(schema/本体)、机器能不能推理。正经版给机器用、能自动推理;个人版给人看、只是把链接可视化,机器读不懂里头的语义。

  3. 朋友说"我在 Obsidian 里搭知识图谱",他说的是哪一种?为什么?

    试着先答

    是比喻版(个人知识管理)。Obsidian 的 graph view 只是把你的笔记双链画出来,没有本体、没有形式化关系,机器不做推理——所以它不是 Google 意义上那种知识图谱。

  4. GraphRAG 为什么要给大语言模型接一张知识图谱?它是万能的吗?

    试着先答

    用图谱里结构化、可追溯的事实当依据,把模型的回答"摁"在事实上,减少幻觉(grounding)。但不是万能:模型读零散三元组也会犯迷糊、照样可能产生跟图谱对不上的幻觉,所以是有用的方向,不是一摁就灵的银弹。

把这几题截图,过两三天再凭记忆答一遍 —— 记得住才算真学会。

引用

Sources

  1. Knowledge graph — Wikipedia — https://en.wikipedia.org/wiki/Knowledge_graph
  2. Knowledge Graph (Google) — Wikipedia(2012 发布、"things not strings"、5 亿→50 亿实体规模)— https://en.wikipedia.org/wiki/Knowledge_Graph_(Google)
  3. What Is a Knowledge Graph? — Ontotext Fundamentals(本体 / 形式化语义)— https://www.ontotext.com/knowledgehub/fundamentals/what-is-a-knowledge-graph/
  4. What Is RDF? — Graphwise Fundamentals(三元组:主-谓-宾,直接映射点-边-点)— https://graphwise.ai/fundamentals/what-is-rdf/
  5. Top Graph Use Cases and Enterprise Applications — Enterprise Knowledge(搜索卡片、企业风控等应用)— https://enterprise-knowledge.com/top-graph-use-cases-and-enterprise-applications-with-real-world-examples/
  6. 11 Applications of Knowledge Graphs — Fabio Chiusano, NLPlanet / Medium(推荐、问答、语音助手)— https://medium.com/nlplanet/nlp-applications-11-applications-of-knowledge-graphs-9596948d3e56
  7. GraphRAG Explained: How Knowledge Graphs Enable Hallucination-Free GenAI — Tredence;及 Detecting Hallucinations in Graph RAG(arXiv 2512.09148,GraphRAG 自身仍会幻觉)— https://www.tredence.com/blog/graphrag-knowledge-graphs-hallucination-free-genai
  8. Personal Knowledge Management with Zettelkasten and Obsidian — DEV Community(卢曼卡片盒、原子笔记、知识非树状)— https://dev.to/yordiverkroost/personal-knowledge-management-with-zettelkasten-and-obsidian-20cj
  9. Obsidian as a Personal Knowledge Graph — Till Freitag(graph view 即笔记双链可视化);Knowledge Base vs Knowledge Graph — PuppyGraph(形式化 schema 的区别)— https://till-freitag.com/en/blog/obsidian-personal-knowledge-graph-en