Claude 的记忆体系
是什么 & 怎么用好

7 种记忆 · 3 个位置 · 4 条用好的心法

记性有限的聪明合伙人，怎么带

物理位置

先搞清楚，记忆到底存在哪。

Cowork 工作时，数据分散在三个完全独立的物理位置。混淆它们，是 90% 误解的源头。

🧠
模型 Token 流当前对话窗口里的消息，是模型"眼睛能看到"的内容。
本轮对话内
☁️
Anthropic 云端对话 transcript 和沙箱容器运行在服务器侧，不在你本机。
30 天 / 会话内
💻
你的 Mac挂载的 Cowork 工作区和 CLAUDE.md 真实躺在你的硬盘上。
永久

全景拆解

七种记忆
逐个登场

从易失的 token，到永久的本地文件——每一种都有自己的位置、形态和寿命。

Token 层 · 易失

① ② 装在"模型眼睛"里的记忆

1

工作记忆Context Window

这一刻模型的输入 token 流，包含系统提示、本轮消息、工具返回。塞满会触发压缩。

模型 Token✗ 跨会话

2

Compact 摘要压缩后的历史梗概

当 context window 接近上限，系统把前文压缩成一段梗概塞回流里。有损压缩，细节丢失。

模型 Token✗ 跨会话

云端层 · 临时

③ ④ 跑在 Anthropic 服务器上的记忆

3

Session Transcript对话原文档案

对话逐条原文 JSONL，存在 Anthropic 服务器。我可通过 session_info 工具主动翻档案室，找回摘要丢失的细节。

云端约 30 天

4

沙箱工作区临时 Linux 容器

一台云端 Ubuntu 容器，我跑代码、写中间文件的地方。你看不到，会话空闲就销毁。

云端沙箱分钟 ~ 小时

文件层 · 半持久 & 永久

⑤ ⑥ 看得见、摸得到的文件记忆

5

用户上传区你拖进来的附件

附件落在沙箱 /mnt/uploads/。部分格式（md/png/pdf 等）同时进入 token 流，我直接能看到。

云端沙箱同会话

6

Cowork 工作区挂载的 Mac 文件夹

你在 Cowork 里选中的 Mac 文件夹，挂载为 /mnt/cowork/。我写 = 直接落你硬盘，Finder 双击即开。

你的 Mac✓ 永久

真正的长期记忆层

⑦ 想让我跨会话记住？写这里。

7

CLAUDE.md 指令记忆

Markdown 配置文件，存在你 Mac 上的全局和项目目录。每次新会话启动时，系统自动把它塞进我的系统提示——不占你打字的功夫，却能让我每次都"记得"你是谁、你要什么规则、项目背景是什么。

✓ 永久 · 每次自动加载 · 真正的人格/规则层

存活周期

活得有多久？一眼看穿。

横向比较各类记忆的生命周期。色条越长，越持久。

① 工作记忆

本轮对话

② Compact 摘要

本会话

④ 沙箱工作区

分钟~小时

⑤ 用户上传

同会话

③ Transcript

约 30 天

⑥ Cowork 工作区

永久

⑦ CLAUDE.md

永久

强锋芒提示

三个最常见的误区。

踩一次浪费半天工作。提前避开。

✕

以为 transcript 是"长期记忆"

Transcript 是云端日志，默认 30 天就清，跨会话检索不稳定。

→ 想永远记住：写进 CLAUDE.md

✕

以为沙箱文件下次还在

沙箱是一次性草稿纸。下次进去是全新容器，上次装的包、写的脚本都没了。

→ 要留：拷到 /mnt/cowork/

✕

以为 compact 就是"忘记"

工作记忆压缩了（有损），但云端 transcript 还有原件，我可以主动去调。

→ 细节追溯：让我读 transcript

实用建议

你要存哪种信息，用哪一层？

跨会话永久记住规则 / 偏好

CLAUDE.md第 7 层

交付物要保留、以后能打开

Cowork 工作区第 6 层

本次会话的临时计算 / 脚本

沙箱第 4 层，别指望下次还在

追溯半小时前的对话细节

读 transcript第 3 层

当前这句话的上下文

Context Window第 1 层，自动

下半场 · 怎么用好

装在哪懂了。怎么用,才是关键。

一个朴素事实:Claude 跟人一样,一次能"吃进"的信息是有限的。不是字数限制,是"消化能力"的限制。

"

一本随机乱码书,和一页结构清晰的笔记——按字数算信息量差不多,但能被吸收的差几十倍。

这个现象,学术上叫 Epiplexity(CMU & NYU, 2026)。说人话就是:塞多少字不重要,塞多少"可吸收的结构"才重要。

四条心法

用好记忆,就四句话。

01

先搭骨架,再放肉

像装修先放梁柱再贴砖。给 Claude 先给大纲/规则/角色,再给细节——没骨架的细节会散架。

→ 顶层框架放最前

02

规则放最前,别藏中间

重要的话先说。人格、护栏、不能碰的底线,永远写在对话/文件的最开始几行。

→ 关键信息贴顶

03

结构比字数重要

一张表格 = 五段散文。能用列表别用段落,能用表格别用列表。

→ 结构化优于散文

04

主动复盘,别等装满

每聊几轮就让 Claude 把要点落到文件里。等 token 窗口塞爆了被动压缩,已经白烧了一轮算力。

→ 持续蒸馏 > 被动压缩

Wayne 的四个观点 · 逐条打分

你的直觉,对了几个?

① 好上下文 = 高结构、自上而下、强约束

✓ 对。这正是"结构密度"的定义。层级越清,Claude 越省力、吸收越高效。论文核心直接支持。

✓ 对

② 提前压缩,别等塞满才清

✓ 方向对。但有个坑:压太快会丢原件细节。正确做法是双轨制——摘要进对话窗口,原文留在 Cowork 工作区,需要时 Claude 主动回去读。

✓ 对·有坑

③ 先思考框架,再动手

✓ 强对。没框架就动手,Claude 每一步都在重新拼结构,算力全烧在脚手架上。论文最强推论之一。

✓ 强对

④ CLAUDE.md 越短越好,已知专业缩写直接用(如 DC = Desktop Commander)

✓ 对。每个 token 每轮都要付费,信噪比必须高。关键:这里的"短"是指用 Claude 已知的标准缩写替代全称——DC、PM、UI、GTM 这类,模型查的是已知映射,无歧义、无额外解码成本,还省上下文预算。要避免的是生造缩写或歧义缩写(例如把某个新业务线缩成两个字母,Claude 不知道指什么)。正确目标:最短且 Claude 无歧义。

✓ 对

黄金法则

3 条要做,3 条别做。

不用记论文,记这六条就够了。

✓

开头先摆框架:角色 / 规则 / 大纲先给,再给细节。

✓

每几轮主动总结:让 Claude 把要点写进 Cowork 文件,原文留作底稿。

✓

能表格别散文:列表、表格、层级标题——密度是段落的好几倍。

✕

别等窗口塞满才压缩:被动压缩 = 已经白烧一轮算力。

✕

别一次性灌满窗口:可能用到的资料放外部文件,让 Claude 按需读。

✕

别生造歧义缩写:已知专业缩写(DC/PM/UI)随便用,自造的新缩写先解释一次。

结语

两句话带走。

存哪? 沙箱 = 草稿纸(用完即焚)· 云端 transcript = 聊天记录(约 30 天)· 你的 Mac = 正式档案(你自己管)。

怎么用? 先搭骨架 · 规则放最前 · 结构比字数重要 · 主动复盘别等爆。

参考资料明细

From Entropy to Epiplexity · Finzi, Qiu, Jiang, Izmailov, Kolter, Wilson

arXiv:2601.03220 · CMU & NYU · 2026.01

上下文治理四原则 / Wayne 观点打分理论基础

Effective Context Engineering for AI Agents

Anthropic Engineering Blog · 2025

持续蒸馏 / 结构化标记 / 双轨制依据

Anthropic Prompt Engineering Guide

docs.claude.com

CLAUDE.md 精简原则与缩写使用依据

Anthropic 隐私中心 · 数据保留政策

privacy.anthropic.com

Transcript 30 天留存依据

当前会话 system prompt · file_handling_rules

本会话环境

沙箱路径、挂载、上传路径依据

session_info MCP 工具定义

本会话工具清单

Transcript 可读性机制

Wayne 全局 & 项目 CLAUDE.md

Mac 本地文件

CLAUDE.md 作为长期记忆层机制

Made for Wayne · 260415