OpenClaw beta 操作者该把恢复代码也当成需要限流的运维面了
OpenClaw issue #80960 报告了一个很具体的现场问题:某个 stuck session 触发 session-file repair 反复写入完整 .bak snapshot,约 25 小时内在 ~/.openclaw/agents/operations/sessions/ 下产生 2,180 个备份文件,累计约 2.1 GB。同一批新可靠性问题还包括:PR #80961 在 agents.defaults.model 用字符串配置、从而静默关闭 model fallbacks 时给出 warning;issue #80877 中 Anthropic Max OAuth 用户被错误提示“top up your API key”,但实际上没有 API key,gateway 稍后会通过 OAuth sync 恢复;PR #80952 让 Telegram plugin commands 在已自行通过 Bot API 发出回复后,可以 suppress 掉重复的 “No response generated” fallback。
影响风险 来源3 对象operator · developer · team
这里真正值得看的不是又一个 bug,而是 recovery code 本身变成了运维面。repair loops、fallback resolution、provider-error formatting、command-handler defaults 本来是为了让失败更安全;但如果没有上限和清晰 contract,它们也可能填满磁盘、移除冗余、误吓终端用户,或污染聊天窗口。Agent 从 demo 走向连续运行几天后,这类问题比单点功能更重要。
- Issue #80960 给出现场数据:一个 stuck session 触发 2,180 个 backup files,约 2.1 GB 增长
- 该 issue 指向 spawn-attempt 与 compaction 两类会重复调用 repair 的路径,并提到 PR #77945 是一种本地清理方案
- PR #80961 为 string model config 增加 runtime / doctor warning,因为它可能静默关闭 fallback behavior
- Issue #80877 记录 Anthropic Max OAuth transient errors 被渲染成 API-key billing failure,并发送到 Telegram
- PR #80952 增加 suppressReply 支持,让 Telegram plugin commands 在 custom delivery 成功后不再追加 “No response generated”
- 最强证据仍是 issue / PR activity,不是新的 stable release
- 磁盘增长依赖 malformed 或反复 repair 的 session 路径,不是每个安装都会复现
- warnings 与文案修复能帮助操作者发现问题,但不能替代 long-running beta gateway 的 staging tests