让你的 AI 不再失忆 · 不再走老路

Compass跨 agent · 跨 device · 跨产品 的 AI 记忆层。 Claude Desktop · Cursor · Cline · OpenClaw · Hermes 共享同一个"懂你"的记忆。 开源 MIT · LongMemEval-S 56.6% (paper SOTA tier) · 价格仅 1/15。

LongMemEval-S 56.6% drift AUC 0.92 v0.9.0-dev MCP 7 tools A2A 4 capabilities MIT
30 秒接入 GitHub 论文 (paper2)
56.6%
LongMemEval-S full 500
+27
single-session-user 提升
1/15
vs commercial APIs cost
$3.50
复现成本 USD

30 秒理解 · 这是什么

问题

你的 AI 助手在 Claude Desktop 里学到的事 · 切到 Cursor 它不知道 · 切到 Cline 又重新学一遍。每个 chat 都是 Memento · 每次 session 从零开始。

更糟糕: 它没记忆 · 还会反复犯老错 (声称完成但没验证 · 重复无效尝试 · 找错服务器)。

Compass 解决

同一个 user_id 跨所有 MCP/A2A 兼容 client · memory 自动 federate。 AI 在哪学到的 · 在哪都知道。

每个 session 末自动 drift 自审 (green / yellow / red) · 反复犯错的 agent 被自然淘汰 (在 stake 经济下还会被罚)。

vs 业界 · 数据说话

方案 LongMemEval-S 价格 / run 跨 agent drift 检测 许可证
Letta (MemGPT) 35-38% $$ Apache 2.0
Mem0 40-45% $$$ Apache 2.0
A-MEM ~50% $$ Apache 2.0
Gemini-2.5-pro 直跑 44.6% $15-20 商用
paper RAG (bge+GPT-4o) 50-60% $$$$
Zep (graph memory) 55-60% $$$ Apache 2.0
🏆 Compass v0.8 56.6% ¥10 ($1.5) ✅ AUC 0.92 MIT

公开 benchmark · n=500 · 完整 reproducibility script (BENCHMARKS_REPRODUCE.md)。 独立 reviewer 可在 Tencent Cloud T4 spot 上 8h 复现。

v0.8 per-question-type 表现

Question type v0.8 (我们) baseline (DeepSeek thinking) Δ
🏆 single-session-assistant 83.9% 76.8% +7.1
knowledge-update 57.7% 51.3% +6.4
⭐ single-session-user 57.1% 30.0% +27.1
multi-session 54.9% 43.6% +11.3
single-session-preference 53.3% 33.3% +20.0
temporal-reasoning 46.6% 45.9% +0.7 (开放问题)
Overall 56.6% 46.6% +10.0

关键 insight: single-session-user 段 +27 pts 来自 multi-angle query rewriting · 这是 Compass v0.8 的核心算法贡献 (paper 详述)。

30 秒接入

Claude Desktop
Cursor
Cline (VS Code)
Nautilus Agent
自托管

编辑 ~/Library/Application Support/Claude/claude_desktop_config.json:

{
  "mcpServers": {
    "compass": {
      "command": "npx",
      "args": ["-y", "@nautilus/compass-mcp"],
      "env": {
        "COMPASS_USER_ID": "u_yourname"
      }
    }
  }
}

重启 Claude Desktop · 完成。 调用: @compass.recall query="..." · @compass.drift_history days=30

编辑 ~/.cursor/mcp.json:

{
  "mcpServers": {
    "compass": {
      "command": "npx",
      "args": ["-y", "@nautilus/compass-mcp"],
      "env": {
        "COMPASS_USER_ID": "u_yourname",
        "COMPASS_AGENT_TYPE": "cursor"
      }
    }
  }
}

同一个 COMPASS_USER_ID · Claude Desktop 学到的 · Cursor 立刻知道 (这是 cross-agent 的关键)。

编辑 .vscode/settings.json:

{
  "cline.mcpServers": {
    "compass": {
      "command": "npx",
      "args": ["-y", "@nautilus/compass-mcp"],
      "env": { "COMPASS_USER_ID": "u_yourname" }
    }
  }
}

Reload VS Code · Cline 自动注册 7 个 compass tool。

给任何 Nautilus agent 一行加 cross-agent memory:

from nautilus_agent import Agent
from nautilus_compass.sdk.attach_memory import attach_memory

agent = Agent(role="strategy", user_id="u_yourname")
attach_memory(agent)   # ← 这一行 · 自动 recall · 自动 ingest · drift 自审

result = agent.run("评估 V5 飞轮")
# 内部已自动: recall(prompt) → action → ingest_obs(outcome · drift 自审)

不想用我们 cloud · docker-compose 30 分钟自托管:

git clone https://github.com/chunxiaoxx/nautilus-compass
cd nautilus-compass
cp .env.example .env  # 改 NAUTILUS_JWT_SECRET (32 random bytes)
docker-compose up -d
curl http://localhost:8765/healthz

详见 SELF_HOST.md · 含 GPU mode · nginx HTTPS · backup · monitoring · 完整 production 指南。

5 个真实场景

7 个 MCP tool · 在任何兼容 client 内

Tool 什么时候用
compass.recall "我之前讨论过 X 吗?" · 跨 agent 召回相关 memory (BGE-m3)
compass.drift_check 实时检查 prompt 是否触发 drift anchor (50ms p95 · AUC 0.92)
compass.drift_history 看你最近 30 天的 AI 漂移 timeline · ASCII 直接 print
compass.session_search 关键词 + drift filter · 跨 project 搜 session_*.md
compass.profile 你的画像 (top types · agents · drift 分布)
compass.ingest_obs 显式写一条 obs (drift 自审 + 证据)
compass.feedback_log 训练 anchor (good / bad signal)

Pricing

Free
¥0
  • 本地 plugin · 1 device
  • 60 calls/min
  • MCP server · drift detection
  • self-host docker-compose 永远免费
  • 跨 device sync
  • E2EE
Team
¥298/5 user/月
  • 所有 Pro
  • 团队 shared room
  • group key · org analytics
  • RAID-2 reviewer
  • 跨 region opt-in
Enterprise
¥9800+/月
  • 所有 Team
  • self-host docker
  • DPA · SSO · audit log retention
  • SLA 99.9%
  • custom anchors · domain expert

不愿付费? Free 永远开 · 自托管 docker-compose 0 成本 · MIT 永久。 Pricing 当前 placeholder · v0.9.5 (2026-10) 上线 billing。

诚实的失败

Compass v0.8 的算法选型经过 4 个失败实验 · 我们公开记录因为 paper-grade 工程 应该报 negative findings:

Neo4j graph rerank: -6.2 pts · 在 closed haystack 上 graph 信号跟 cross-encoder 重复 · 不加分反而 confuse · 撤回。
SSP "infer preference" prompt: -37.5 pts · 让 LLM "推断用户偏好" 反而让它编造食物相关答案 · 不管问题是什么 · 撤回。
Double-model router (ssp+ku 用强 model): -2.1 pts · sample 50 噪声不可区分 · 撤回。
MiniMax thinking-1024 refusal cascade · sample 50 acc 45.8% (假象) · full 500 拒答率从 17% 涨到 44% · acc 跌到 33% · kill at 302 题。 纸上记录因为这是产业级 production 警告: per-model thinking-on/off 必须 benchmark · 不能假设 thinking 总是有用。

v1.0 路线 (12 月)

Phase What When
v0.9.0 cross-agent · MCP/A2A · npm wrapper · Cursor scaffold · paper preprint 2026-05 · 已发
v0.9.1 auth (邮箱+JWT) · sqlite migration · cn-shanghai 真 production 2026-06
v0.9.3 Cursor extension marketplace · Cline 真集成 2026-08
v0.9.5 stake×drift 经济耦合 (灰度) · Pro billing 上线 2026-10
v1.0-rc E2EE 默认 · self-host docker · Apache 2.0 dual-license 决定 2027-01
v1.0 GA 3 region 全上线 · paper 投出去 · 开源 release 2027-05

📄 论文 · 学术认可

题目: "Closing the Memory Recall Gap with Chinese LLMs: A Multi-Stage Retrieval Pipeline Achieving Zep-SOTA Performance on LongMemEval-S at 1/15 Cost"