← → 键切换 · 滑动 · 点击

Claude 的记忆体系
是什么 & 怎么用好

7 种记忆 · 3 个位置 · 4 条用好的心法

记性有限的聪明合伙人,怎么带
物理位置

先搞清楚,记忆到底存在哪。

Cowork 工作时,数据分散在三个完全独立的物理位置。混淆它们,是 90% 误解的源头。

🧠

模型 Token 流

当前对话窗口里的消息,是模型"眼睛能看到"的内容。

本轮对话内
☁️

Anthropic 云端

对话 transcript 和沙箱容器运行在服务器侧,不在你本机。

30 天 / 会话内
💻

你的 Mac

挂载的 Cowork 工作区和 CLAUDE.md 真实躺在你的硬盘上。

永久
全景拆解

七种记忆
逐个登场

从易失的 token,到永久的本地文件——每一种都有自己的位置、形态和寿命。

Token 层 · 易失

① ②  装在"模型眼睛"里的记忆

1
工作记忆Context Window

这一刻模型的输入 token 流,包含系统提示、本轮消息、工具返回。塞满会触发压缩。

模型 Token✗ 跨会话
2
Compact 摘要压缩后的历史梗概

当 context window 接近上限,系统把前文压缩成一段梗概塞回流里。有损压缩,细节丢失。

模型 Token✗ 跨会话
云端层 · 临时

③ ④  跑在 Anthropic 服务器上的记忆

3
Session Transcript对话原文档案

对话逐条原文 JSONL,存在 Anthropic 服务器。我可通过 session_info 工具主动翻档案室,找回摘要丢失的细节。

云端约 30 天
4
沙箱工作区临时 Linux 容器

一台云端 Ubuntu 容器,我跑代码、写中间文件的地方。你看不到,会话空闲就销毁。

云端沙箱分钟 ~ 小时
文件层 · 半持久 & 永久

⑤ ⑥  看得见、摸得到的文件记忆

5
用户上传区你拖进来的附件

附件落在沙箱 /mnt/uploads/。部分格式(md/png/pdf 等)同时进入 token 流,我直接能看到。

云端沙箱同会话
6
Cowork 工作区挂载的 Mac 文件夹

你在 Cowork 里选中的 Mac 文件夹,挂载为 /mnt/cowork/。我写 = 直接落你硬盘,Finder 双击即开。

你的 Mac✓ 永久
真正的长期记忆层

⑦  想让我跨会话记住?写这里。

7

CLAUDE.md 指令记忆

Markdown 配置文件,存在你 Mac 上的全局和项目目录。每次新会话启动时,系统自动把它塞进我的系统提示——不占你打字的功夫,却能让我每次都"记得"你是谁、你要什么规则、项目背景是什么。

✓ 永久 · 每次自动加载 · 真正的人格/规则层
存活周期

活得有多久?一眼看穿。

横向比较各类记忆的生命周期。色条越长,越持久。

① 工作记忆
本轮对话
② Compact 摘要
本会话
④ 沙箱工作区
分钟~小时
⑤ 用户上传
同会话
③ Transcript
约 30 天
⑥ Cowork 工作区
永久
⑦ CLAUDE.md
永久
强锋芒提示

三个最常见的误区。

踩一次浪费半天工作。提前避开。

以为 transcript 是"长期记忆"

Transcript 是云端日志,默认 30 天就清,跨会话检索不稳定。

→ 想永远记住:写进 CLAUDE.md

以为沙箱文件下次还在

沙箱是一次性草稿纸。下次进去是全新容器,上次装的包、写的脚本都没了。

→ 要留:拷到 /mnt/cowork/

以为 compact 就是"忘记"

工作记忆压缩了(有损),但云端 transcript 还有原件,我可以主动去调。

→ 细节追溯:让我读 transcript
实用建议

你要存哪种信息,用哪一层?

跨会话永久记住规则 / 偏好
CLAUDE.md第 7 层
交付物要保留、以后能打开
Cowork 工作区第 6 层
本次会话的临时计算 / 脚本
沙箱第 4 层,别指望下次还在
追溯半小时前的对话细节
读 transcript第 3 层
当前这句话的上下文
Context Window第 1 层,自动
下半场 · 怎么用好

装在哪懂了。怎么用,才是关键。

一个朴素事实:Claude 跟人一样,一次能"吃进"的信息是有限的。不是字数限制,是"消化能力"的限制。

"

一本随机乱码书,和一页结构清晰的笔记——按字数算信息量差不多,但能被吸收的差几十倍。

这个现象,学术上叫 Epiplexity(CMU & NYU, 2026)。说人话就是:塞多少字不重要,塞多少"可吸收的结构"才重要。

四条心法

用好记忆,就四句话。

01

先搭骨架,再放肉

像装修先放梁柱再贴砖。给 Claude 先给大纲/规则/角色,再给细节——没骨架的细节会散架。

→ 顶层框架放最前
02

规则放最前,别藏中间

重要的话先说。人格、护栏、不能碰的底线,永远写在对话/文件的最开始几行。

→ 关键信息贴顶
03

结构比字数重要

一张表格 = 五段散文。能用列表别用段落,能用表格别用列表。

→ 结构化优于散文
04

主动复盘,别等装满

每聊几轮就让 Claude 把要点落到文件里。等 token 窗口塞爆了被动压缩,已经白烧了一轮算力。

→ 持续蒸馏 > 被动压缩
Wayne 的四个观点 · 逐条打分

你的直觉,对了几个?

① 好上下文 = 高结构、自上而下、强约束
✓ 对。这正是"结构密度"的定义。层级越清,Claude 越省力、吸收越高效。论文核心直接支持。
✓ 对
② 提前压缩,别等塞满才清
✓ 方向对。但有个坑:压太快会丢原件细节。正确做法是双轨制——摘要进对话窗口,原文留在 Cowork 工作区,需要时 Claude 主动回去读。
✓ 对·有坑
③ 先思考框架,再动手
✓ 强对。没框架就动手,Claude 每一步都在重新拼结构,算力全烧在脚手架上。论文最强推论之一。
✓ 强对
④ CLAUDE.md 越短越好,已知专业缩写直接用(如 DC = Desktop Commander)
✓ 对。每个 token 每轮都要付费,信噪比必须高。关键:这里的"短"是指用 Claude 已知的标准缩写替代全称——DC、PM、UI、GTM 这类,模型查的是已知映射,无歧义、无额外解码成本,还省上下文预算。要避免的是生造缩写或歧义缩写(例如把某个新业务线缩成两个字母,Claude 不知道指什么)。正确目标:最短且 Claude 无歧义。
✓ 对
黄金法则

3 条要做,3 条别做。

不用记论文,记这六条就够了。

开头先摆框架:角色 / 规则 / 大纲先给,再给细节。
每几轮主动总结:让 Claude 把要点写进 Cowork 文件,原文留作底稿。
能表格别散文:列表、表格、层级标题——密度是段落的好几倍。
别等窗口塞满才压缩:被动压缩 = 已经白烧一轮算力。
别一次性灌满窗口:可能用到的资料放外部文件,让 Claude 按需读。
别生造歧义缩写:已知专业缩写(DC/PM/UI)随便用,自造的新缩写先解释一次。
结语

两句话带走。

存哪? 沙箱 = 草稿纸(用完即焚)· 云端 transcript = 聊天记录(约 30 天)· 你的 Mac = 正式档案(你自己管)。

怎么用? 先搭骨架 · 规则放最前 · 结构比字数重要 · 主动复盘别等爆。

参考资料明细
From Entropy to Epiplexity · Finzi, Qiu, Jiang, Izmailov, Kolter, Wilson
arXiv:2601.03220 · CMU & NYU · 2026.01
上下文治理四原则 / Wayne 观点打分理论基础
Effective Context Engineering for AI Agents
Anthropic Engineering Blog · 2025
持续蒸馏 / 结构化标记 / 双轨制依据
Anthropic Prompt Engineering Guide
docs.claude.com
CLAUDE.md 精简原则与缩写使用依据
Anthropic 隐私中心 · 数据保留政策
privacy.anthropic.com
Transcript 30 天留存依据
当前会话 system prompt · file_handling_rules
本会话环境
沙箱路径、挂载、上传路径依据
session_info MCP 工具定义
本会话工具清单
Transcript 可读性机制
Wayne 全局 & 项目 CLAUDE.md
Mac 本地文件
CLAUDE.md 作为长期记忆层机制

Made for Wayne · 260415