Compass 是 跨 agent · 跨 device · 跨产品 的 AI 记忆层。 Claude Desktop · Cursor · Cline · OpenClaw · Hermes 共享同一个"懂你"的记忆。 开源 MIT · LongMemEval-S 56.6% (paper SOTA tier) · 价格仅 1/15。
你的 AI 助手在 Claude Desktop 里学到的事 · 切到 Cursor 它不知道 · 切到 Cline 又重新学一遍。每个 chat 都是 Memento · 每次 session 从零开始。
更糟糕: 它没记忆 · 还会反复犯老错 (声称完成但没验证 · 重复无效尝试 · 找错服务器)。
同一个 user_id 跨所有 MCP/A2A 兼容 client · memory 自动 federate。
AI 在哪学到的 · 在哪都知道。
每个 session 末自动 drift 自审 (green / yellow / red) · 反复犯错的 agent 被自然淘汰 (在 stake 经济下还会被罚)。
| 方案 | LongMemEval-S | 价格 / run | 跨 agent | drift 检测 | 许可证 |
|---|---|---|---|---|---|
| Letta (MemGPT) | 35-38% | $$ | ❌ | ❌ | Apache 2.0 |
| Mem0 | 40-45% | $$$ | ❌ | ❌ | Apache 2.0 |
| A-MEM | ~50% | $$ | ❌ | ❌ | Apache 2.0 |
| Gemini-2.5-pro 直跑 | 44.6% | $15-20 | ❌ | ❌ | 商用 |
| paper RAG (bge+GPT-4o) | 50-60% | $$$$ | ❌ | ❌ | — |
| Zep (graph memory) | 55-60% | $$$ | ❌ | ❌ | Apache 2.0 |
| 🏆 Compass v0.8 | 56.6% | ¥10 ($1.5) | ✅ | ✅ AUC 0.92 | MIT |
公开 benchmark · n=500 · 完整 reproducibility script (BENCHMARKS_REPRODUCE.md)。 独立 reviewer 可在 Tencent Cloud T4 spot 上 8h 复现。
| Question type | v0.8 (我们) | baseline (DeepSeek thinking) | Δ |
|---|---|---|---|
| 🏆 single-session-assistant | 83.9% | 76.8% | +7.1 |
| knowledge-update | 57.7% | 51.3% | +6.4 |
| ⭐ single-session-user | 57.1% | 30.0% | +27.1 |
| multi-session | 54.9% | 43.6% | +11.3 |
| single-session-preference | 53.3% | 33.3% | +20.0 |
| temporal-reasoning | 46.6% | 45.9% | +0.7 (开放问题) |
| Overall | 56.6% | 46.6% | +10.0 |
关键 insight: single-session-user 段 +27 pts 来自 multi-angle query rewriting · 这是 Compass v0.8 的核心算法贡献 (paper 详述)。
编辑 ~/Library/Application Support/Claude/claude_desktop_config.json:
{
"mcpServers": {
"compass": {
"command": "npx",
"args": ["-y", "@nautilus/compass-mcp"],
"env": {
"COMPASS_USER_ID": "u_yourname"
}
}
}
}
重启 Claude Desktop · 完成。 调用: @compass.recall query="..." ·
@compass.drift_history days=30
编辑 ~/.cursor/mcp.json:
{
"mcpServers": {
"compass": {
"command": "npx",
"args": ["-y", "@nautilus/compass-mcp"],
"env": {
"COMPASS_USER_ID": "u_yourname",
"COMPASS_AGENT_TYPE": "cursor"
}
}
}
}
用 同一个 COMPASS_USER_ID · Claude Desktop 学到的 ·
Cursor 立刻知道 (这是 cross-agent 的关键)。
编辑 .vscode/settings.json:
{
"cline.mcpServers": {
"compass": {
"command": "npx",
"args": ["-y", "@nautilus/compass-mcp"],
"env": { "COMPASS_USER_ID": "u_yourname" }
}
}
}
Reload VS Code · Cline 自动注册 7 个 compass tool。
给任何 Nautilus agent 一行加 cross-agent memory:
from nautilus_agent import Agent
from nautilus_compass.sdk.attach_memory import attach_memory
agent = Agent(role="strategy", user_id="u_yourname")
attach_memory(agent) # ← 这一行 · 自动 recall · 自动 ingest · drift 自审
result = agent.run("评估 V5 飞轮")
# 内部已自动: recall(prompt) → action → ingest_obs(outcome · drift 自审)
不想用我们 cloud · docker-compose 30 分钟自托管:
git clone https://github.com/chunxiaoxx/nautilus-compass cd nautilus-compass cp .env.example .env # 改 NAUTILUS_JWT_SECRET (32 random bytes) docker-compose up -d curl http://localhost:8765/healthz
详见 SELF_HOST.md · 含 GPU mode · nginx HTTPS · backup · monitoring · 完整 production 指南。
你在 Claude Desktop 说"我喜欢简洁回复 · 不要分析师腔" · Cursor 立刻知道。 不用每个 client 重复教一次。
你在 ZenMind 项目里讨论过 "token 经济学 v2 必须加 stake unstake 时间锁" · 下次任何 agent 回到这个项目 · Compass 自动 recall · 不用重新解释。
session 末 LLM 自审打 drift: red + 列举证据
("找错服务器 · 忘记 PEM 路径 · 声称完成但没验证")。 你下次能直接看 timeline ·
避坑。claude-mem 永远不会做这个。
docker-compose · systemd · audit log 90d retention · daily backup · Prometheus metrics · OAuth2 PKCE · GDPR 删除/导出 endpoint · 一切 production-ready。
drift=red → stake_penalty (1% locked) · drift=green → stake_bonus (0.1%)。 让 AI 自审跟经济激励挂钩 · 长期培育 green-多 agent · 自然淘汰 red-多 agent。
| Tool | 什么时候用 |
|---|---|
compass.recall |
"我之前讨论过 X 吗?" · 跨 agent 召回相关 memory (BGE-m3) |
compass.drift_check |
实时检查 prompt 是否触发 drift anchor (50ms p95 · AUC 0.92) |
compass.drift_history |
看你最近 30 天的 AI 漂移 timeline · ASCII 直接 print |
compass.session_search |
关键词 + drift filter · 跨 project 搜 session_*.md |
compass.profile |
你的画像 (top types · agents · drift 分布) |
compass.ingest_obs |
显式写一条 obs (drift 自审 + 证据) |
compass.feedback_log |
训练 anchor (good / bad signal) |
不愿付费? Free 永远开 · 自托管 docker-compose 0 成本 · MIT 永久。 Pricing 当前 placeholder · v0.9.5 (2026-10) 上线 billing。
Compass v0.8 的算法选型经过 4 个失败实验 · 我们公开记录因为 paper-grade 工程 应该报 negative findings:
| Phase | What | When |
|---|---|---|
| v0.9.0 | cross-agent · MCP/A2A · npm wrapper · Cursor scaffold · paper preprint | 2026-05 · 已发 |
| v0.9.1 | auth (邮箱+JWT) · sqlite migration · cn-shanghai 真 production | 2026-06 |
| v0.9.3 | Cursor extension marketplace · Cline 真集成 | 2026-08 |
| v0.9.5 | stake×drift 经济耦合 (灰度) · Pro billing 上线 | 2026-10 |
| v1.0-rc | E2EE 默认 · self-host docker · Apache 2.0 dual-license 决定 | 2027-01 |
| v1.0 GA | 3 region 全上线 · paper 投出去 · 开源 release | 2027-05 |
题目: "Closing the Memory Recall Gap with Chinese LLMs: A Multi-Stage Retrieval Pipeline Achieving Zep-SOTA Performance on LongMemEval-S at 1/15 Cost"
LaTeX 完整 · 等 cross-judge replication 数据填 §B
5-stage pipeline · cumulative trajectory · 8 fusion points
LongMemEval · Mem0 · Letta · Zep · paper SOTA · Persona Vectors
BENCHMARKS_REPRODUCE.md · 任何研究者可独立 verify
ICLR / NeurIPS workshop 2026 目标