OpenClaw 最新风险不在模型能力,而在会话卫生
OpenClaw beta 后最值得看的不是单个功能,而是一组 session integrity 报告。Issue #48241 说,当同一会话里用户快速连续发消息时,运行会被 abort,但系统仍可能写入一条 assistant 回复,内容来自无关的 stale buffer;日志里的 token count 与可见文本长度也对不上。PR #48283 的修复方向是丢弃 aborted assistant messages,而不是把它们发给用户。另一条 compaction 线指出,长期会话接近 94% context 时可能堆积 tool-failure loops、stale reminders 和弱用户目标跟踪;PR #48350 新增 post-compaction validator,用来检查目标保留、待办保留、stale system promotion、failure collapse 和是否应建议 reset。相邻两个需求也指向同一问题:thread 里的图片需要 timestamp / position metadata,避免旧截图压过用户的新文字;secure chat mode 则让敏感会话能选择不写 transcript、summary 和 memory。
影响风险 来源3 对象operator · developer · team
常驻 Agent 的正确性不只是模型会不会回答,而是 runtime 能不能把正确的对话、正确的用户请求和正确的记忆边界绑定到每次回复上。stale buffer delivery、污染后的 compaction、旧图片误导、以及无法关闭的持久化,是同一种产品风险的不同侧面:个人 Agent 听起来很自信,但已经丢了 session truth。
- Issue #48241 报告 aborted runs 写入无关 assistant content;上游日志没有对应模型请求,token count 也与可见回复长度不一致
- PR #48283 将原因指向 abort 后残留的 streaming buffer,并加入逻辑在写入或投递前剔除 aborted assistant messages
- Issue #48238 描述一个 256k / 272k 的饱和会话,出现反复 tool-failure loops、stale reminder / system reinjection,最后需要 transcript backup 和 reset 才恢复
- PR #48350 新增纯 post-compaction validator,并覆盖 goal retention、pending-item retention、stale-system promotion、failure collapse、compaction evidence 和保守 reset recommendation 测试
- Issue #48321 要求给 thread history 中的图片注入 timestamp 和 position metadata,让模型能区分旧截图与当前状态
- Issue #48159 要求 per-session secure chat mode,让敏感对话不进入 transcript、summary、compaction 和 memory persistence
- 多项修复仍是 open PR 或 feature request,不是 tagged release
- 这种故障很难肉眼识别,因为 stale 或污染后的文本仍可能流畅且貌似合理
- compaction validator 能发现质量问题,但操作者仍需要清晰的 reset、backup 和用户通知流程
- secure chat mode 目前仍是需求,用户不应假设敏感对话已经不会持久化