写在前面
什么是认知科学?它是在计算机科学与心理科学基础上,诞生于二十世纪七十年代的一门学科,主要研究人类心智如何工作。
经历漫长的发展,认知科学如同多数学科一样,呈现了明显的范式代际变革,我们通常可以将其划分为三代:表征计算主义、4E、预测心智理论。
第一代认知科学:表征计算主义。代表人物是计算视觉的奠基者大卫·马尔(David Marr),相关图书参见《视觉》。
第一代认知科学通常遵循马尔提出的范式:计算-算法-实现,以符号式信息处理框架解释感知、认知和行动。它推动了认知科学的早期发展,更形成了计算视觉、计算语言学等众多人工智能分支。
第二代认知科学:4E——具身认知、嵌入认知、生成认知、延展认知。源自詹姆斯·吉布森(James Gibson)等人开创的生态心理学与可供性理论脉络,而之后被众多认知科学家继承并发扬光大。
所谓 4E,为具身的(Embodied)、嵌入的(Embedded)、生成的(Enacted)、延展的(Extended)四个英文单词的首字母组合。
具身认知的代表作是《具身认知》(Lawrence Shapiro);
嵌入认知的代表作是The Bounds of Cognition(Frederick Adams & Kenneth Aizawa)或情境认知相关著作,如The Cambridge Handbook of Situated Cognition(Philip Robbins & Murat Aydede);
生成认知的早期代表作是《具身心智:认知科学与人类经验》(Francisco Varela、Evan Thompson、Eleanor Rosch),近些年的代表作是遵循吉布森可供性进路并结合现象学的《生成主义干预》(Shaun Gallagher)以及Action in Perception(Alva Noë);
延展认知的代表作是《放大心灵:具身、行为与认知延展》与《此在:重整大脑、身体与世界》(Andy Clark)。
而综述第二代认知科学的代表作是马克·罗兰兹(Mark Rowlands)的《新认知科学》(The New Science of the Mind)与肖恩·加拉格尔(Shaun Gallagher)主编的The Oxford Handbook of 4E Cognition。
相对第一代认知科学,第二代认知科学认为认知不仅仅发生在大脑内部,更是具身的(身体参与)、嵌入的(依赖特定情境)、生成的(在行动中生成)、延展的(借助工具延展),从而将认知视为一种大脑—身体—环境在情境中的动态耦合过程。
第三代认知科学:预测心智理论。目前正在蓬勃兴起,其理论源自神经科学家卡尔·弗里斯顿(Karl Friston)的主动推理与自由能原理(Free Energy Principle,即FEP)在认知科学领域的应用,在不同场合也称为预测加工(Predictive Processing,即PP)、预测编码(Predictive Coding)、预测大脑(Predictive Brain)理论。
预测心智理论的核心思想是将大脑看作为一台预测机器,通过分层生成模型最小化预测误差/惊讶(自由能),将感知视为贝叶斯推断、行动视为主动推理、学习视为模型更新,从而统一解释知觉、决策和适应。
目前,大众对认知科学的理解多停留在第一代,偶尔涉及第二代,但对第三代认知科学了解较少,因此,特整理四本代表作,帮助各位读者了解当前认知科学的前沿进展。
书 1:《主动推理》

弗里斯顿是目前论文引用次数最高的神经科学家,也是神经成像技术的奠基者之一。他开发的用于分析脑成像数据的软件包 SPM(Statistical Parametric Mapping),是神经科学领域应用最广泛的软件之一。
在职业生涯早期取得如此高的成就,许多人可能会因此而满足。然而,弗里斯顿并未止步。他在四五十岁时转向理论神经科学,尝试提出一个大一统理论。这正是主动推理与自由能原理。
《主动推理》一书由弗里斯顿与同事联合撰写,这本书可能是目前对主动推理与自由能原理阐释最清晰的一本。
这本书内容较为硬核,书中充满数学推导以及大量认知科学和神经科学知识。即使是认知科学、神经科学及心理科学领域的专业从业者,也可能难以完全理解。实际上,作者在书中尝试一次性回答三个问题:
(1)主动推理或自由能原理本身:主动推理或自由能原理为何重要?它涉及哲学、物理学、数学、信息论、认知科学、神经科学及心理科学的哪些背景?其核心思想是什么?主动推理或自由能原理的形式化规则及神经生物学基础分别是什么?这是第一章到第五章回答的问题。
(2)如何建模:作为计算认知科学家、神经学家、心理学家或精神病学家,应该如何建立主动推理模型以预测某些人类现象?如何设计模型、收集数据并分析数据?这是第六章到第九章回答的问题。
(3)如何用它统一认知科学、神经科学与心理科学:作为目前认知科学、神经科学及心理科学界唯一的大一统理论,如何以此为基础,重新审视传统已有研究?当前各个传统研究分支领域,使用自由能原理获得了哪些新的知识?如果我们编写一本大一统的心理学新教材,又该如何写?这就是本书第十章回答的问题。
如此庞大的信息量,放在一本短短的四百余页的书中,自然使得每个话题都值得进一步探索。书中几乎每句话背后,都有大量论文或学界争论作为支撑。对普通读者来说,消化起来可能会颇为吃力。
我的长篇书评与数学推导参见:https://t.zsxq.com/XTYqH
-
中文书目:托马斯·帕尔, 乔瓦尼·佩祖洛, & 卡尔·弗里斯顿. (2024). 主动推理 (刘林澍 译). 机械工业出版社.
-
英文书目:Thomas Parr, Giovanni Pezzulo, & Karl J. Friston. (2022). Active Inference. MIT Press.
书 2:《预测心智》

作者雅克布·霍威(Jakob Hohwy)是第一批将主动推理与自由能原理应用于认知科学的学者。该书英文版 The Predictive Mind 出版于 2013 年,可以说是第三代认知科学的启蒙之作。
正是从这本书开始,认知科学界逐渐形成共识:大脑本质上是一台假设-验证机,尝试对从世界中接收的信号进行预测,并使误差最小化。
-
中文书目:雅克布·霍威. (2022). 预测心智 (王静、万舒婵 译). 上海人民出版社.
-
英文书目:Hohwy, J. (2013). The Predictive Mind. Oxford University Press.
书 3:《预测算法》

第三代认知科学有两位代表人物:雅克布·霍威(Jakob Hohwy)与安迪·克拉克(Andy Clark)。在具体论述上,两人大为不同,目前学界的讨论结果更倾向于支持克拉克。
克拉克是第二代认知科学 4E 中的延展认知代表人物。最近几年,国内先后出版了他的早年杰作《放大心灵:具身、行为与认知延展》(2022 年)、《心体:认知科学与人工智能的哲学挑战》(2024 年)与《在此:重整大脑、身体与世界》(2025 年)。这些著作的英文版则分别首次出版于 2008 年、2000 年、1998 年。
自 2005 年主动推理与自由能原理诞生后,克拉克几乎将自己所有精力都转向于此。早在 2013 年,克拉克在知名学术期刊 Behavioral and Brain Sciences 上发表了论文:Whatever next? Predictive brains, situated agents, and the future of cognitive science。
在这篇论文中,克拉克系统性地阐述了「大脑即预测机器」的理论框架,提出大脑通过分层生成模型不断对外部世界进行预测,并通过最小化预测误差来指导感知与行动。他不仅梳理了该理论的核心要素及其对感知、注意力与能动性的深刻影响,还对该理论可能面临的实证、方法论和概念性挑战进行了分析。
这篇论文被认为是第三代认知科学的重要代表作,极大地促进了认知科学界对预测心智领域的关注。
克拉克不满足于发表论文,更是著书立说。在 2016 年出版了Surfing Uncertainty: Prediction, Action, and the Embodied Mind一书,该书被学界普遍认为是预测心智理论的集大成之作,系统阐述了预测心智对认知科学的影响。
2022 年,他又出版了一本新书 The Experience Machine: How Our Minds Predict and Shape Reality,继续科普并深化预测心智理论。
这两本书近些年均已有中文简体版,前者为 2020 年出版的《预测算法》,后者为 2025 年出版的《体验机器》。
-
中文书目:安迪·克拉克. (2020). 预测算法 (刘林澍 译). 机械工业出版社.
-
英文书目:Clark, A. (2016). Surfing Uncertainty: Prediction, Action, and the Embodied Mind. Oxford University Press.
书 4:A Drive to Survive

主动推理与自由能原理,以及预测心智理论自诞生以来,批评声音从未间断。近年来,青年学者凯瑟琳·纳维(Kathryn Nave)尤为引人注目。自 2020 年起,她陆续发表了一系列批判论文。
2020 年,Nave 的博士论文《每个人都要吃:为什么生物系统不能仅靠预测误差最小化生存》(Every body’s gotta eat: why living systems can’t survive on prediction error minimization alone)对这些问题做了深入探讨。
2025 年,她在博士论文基础上,出版了新书《生存驱动:自由能原理与生命意义》A Drive to Survive: The Free Energy Principle and the Meaning of Life,进一步阐述并深化了自己的观点。
Nave 认为,尽管自由能原理为统一认知科学提供了有力的理论工具,但它对「生命」与「非生命」系统的区分过于宽泛,甚至淡化了生命的独特性。
在她看来,自由能原理将「生命」简化为「统计稳态」,而这种定义同样适用于任何能够维持自身状态的系统——无论是一块岩石、一台恒温器,还是一个活生生的有机体。结果,生命与非生命之间最本质的界限被模糊了。
Nave 强调,生命体与非生命系统的根本区别,在于生命的高度不稳定性和持续的物质更替(如细胞膜分子在较短时间内可被大部分更新),以及发展变异的不可预见性(如细菌通过基因水平转移获得新能力,这种变化无法用统计不变量预先描述)。
生命不是静止的「事物」,而是一个不断生成、持续变化的过程。其同一性来自历史性的生成关系——通过新陈代谢、物质能量交换以及与环境的动态耦合,生命体得以持续自我生产和更新。
- 英文书目:Kathryn Nave. (2025). A Drive to Survive: The Free Energy Principle and the Meaning of Life. MIT Press.
相关论文与教程
由于上述著作多为对 Karl Friston 思想的发挥,甚至包括《主动推理》这本由 Karl Friston 署名的著作也是如此,因此不可避免地存在对 Karl Friston 思想的曲解。
因此,有必要回到 Karl Friston 的关键文献。Karl Friston 本人关于主动推理与自由能原理的阐述,大致可以分为三个时期。
2005、2006 年的论文为自由能原理的理论前身。这个时期的重要论文如下:
-
Friston, K. (2005). A theory of cortical responses. Philosophical Transactions of the Royal Society B: Biological Sciences, 360(1456), 815–836.
-
Friston, K., Kilner, J., & Harrison, L. (2006). A free energy principle for the brain. Journal of Physiology-Paris, 100(1–3), 70–87.
2007—2010 年系列论文为自由能原理的系统成型与核心综述。这个时期的重要论文如下:
-
Friston, K., & Stephan, K. E. (2007). Free-energy and the brain. Synthese, 159(3), 417–458.
-
Friston, K. , & Kiebel, S.(2008). Predictive coding under the free-energy principle. Philosophical Transactions of the Royal Society B: Biological Sciences, 364(1521), 1211–1221.
-
Friston, K. (2009). The free-energy principle: A rough guide to the brain? Trends in Cognitive Sciences, 13(7), 293–301.
-
Friston, K. (2010). The free-energy principle: A unified brain theory? Nature Reviews Neuroscience, 11(2), 127–138.
2018 年至 2023 年的论文为理论的进一步数学深化与哲学探讨。这个时期的重要论文如下:
-
Ramstead, M. J. D., Badcock, P. B., & Friston, K. (2018). Answering Schrödinger’s question: A free-energy formulation. Physics of Life Reviews, 24, 1–16.
-
Friston, K. (2018). Does predictive coding have a future? Nature Reviews Neuroscience, 19(11), 663–665.
-
Friston, K., Da Costa, L., Sajid, N., Heins, C., Ueltzhöffer, K., Pavliotis, G. A., & Parr, T. (2023). The free energy principle made simpler but not too simple. Physics Reports, 1012, 1–29.
其中,最为关键的入门文献包括:
-
Friston, K., & Stephan, K. E. (2007). Free-energy and the brain. Synthese, 159(3), 417–458.
这篇 2007 年发表在 Synthese 上的论文,讨论了自由能原理与认知建模的关系,尤其是其在解释大脑功能中的作用。 -
Friston, K. (2009). The free-energy principle: a rough guide to the brain? Trends in Cognitive Sciences, 13(7), 293–301.
这篇 2009 年发表在 Trends in Cognitive Sciences 上的论文,是理解自由能原理最重要、也是最早的起点之一。 -
Friston, K. (2010). The free-energy principle: a unified brain theory? Nature Reviews Neuroscience, 11(2), 127–138.
这篇 2010 年发表在 Nature Reviews Neuroscience 的论文,是自由能原理的经典综述,系统阐述了自由能原理如何作为大脑功能的统一理论,涵盖知觉、行动和学习等主题。 -
Ramstead, M. J. D., Badcock, P. B., & Friston, K.. (2018). Answering Schrödinger’s question: A free-energy formulation. Physics of Life Reviews, 24, 1–16.
这篇 2018 年发表在 Physics of Life Reviews 上的论文,给出了自由能公式的详细推导,以及它如何回应薛定谔在《生命是什么》中提出的问题。 -
Friston, K., Da Costa, L., Sajid, N., Heins, C., Ueltzhöffer, K., Pavliotis, G. A., & Parr, T. (2023). The free energy principle made simpler but not too simple. Physics Reports, 1012, 1–29.
这篇 2023 年发表在 Physics Reports 上的论文,给出了自由能公式更详细的推导,并探讨了生命与世界作为一个随机动力系统的关系。
而中文论文则可参考刘林澍、王姝彦、何静、陈巍、孙玉婷等人。硕博论文可参考赵婷婷、郑念、武锐、龚洁等人。科学计量学论文可参考刘燊。其他相关论文可参考李雪玉、于爽、徐竹、孙骞谦、王球、朱林蕃等人。
主动推理与自由能原理的工程实现,教程可以参考论文:
Smith, R., Friston, K. J., & Whyte, C. J. (2022). A step-by-step tutorial on active inference and its application to empirical data. Journal of mathematical psychology, 107, 102632.
原始代码使用 Matlab 语言编写。为了推广 Friston 自由能原理的思想,开智社群希瑞博士创建了一个开源项目,将代码转换为 Python 语言。参见:https://github.com/ouyangzhiping/feppy
由于原始代码中有几个例子依赖大量 SPM 库函数,所以希瑞目前仍在将 SPM 改写为 Python,目前完成了大约 70%左右的工作量。
同样,Friston 的思想对人工智能界亦产生了一定影响。其中,他担任首席科学家的公司 Verses 尝试开发出不同架构的新型 AI 系统。
该公司的工程师 Sanjeev Namjoshi 撰写的新书Fundamentals of Active Inference: Principles, Algorithms, and Applications of the Free Energy Principle for Engineers,尝试以工程技术视角,对主动推理与自由能原理进行系统性梳理和普及,该书预计于 2026 年出版。
小结
我个人认为,主动推理与自由能原理,以及预测心智理论为认知科学做出了极为大胆而新锐的贡献,堪称 21 世纪最值得关注的哲学与科学进展之一。
但停留在此,远远不够。如果要更好地解释人类心智,至少需要在哲学思辨、科学实验和工程实现三方面,同时兼容三代认知科学的成果。
人类心智究竟如何工作?这也是包括我在内的无数学者毕生探索的大问题。也许,我们对人类心智之谜,只能不断逼近真相,而无法真正抵达。然而,进一寸,便有一寸的欢喜。