AI 写得太快,肉眼看不过来:当 Code Review 成为新瓶颈

Posted on 三 24 6月 2026 in Journal • Tagged with AI, code review, claude code, codex, workflow, engineering, PKB

Claude Code 和 Codex 把写代码这件事的速度推到 5 倍、10 倍,但人脑的阅读速度还是那个阅读速度。结果是:MR 排成长队,reviewer 心虚地点 Approve,bug 一个接一个上线。不看不放心,全看没时间——这篇文章给你一套既要速度又要质量的 review 分层策略。


Continue reading

用 Codex 怎么省 Token:账单别让上下文偷偷烧掉

Posted on 二 23 6月 2026 in Tech • Tagged with codex, ai, token, cost, context, productivity, agents-md

用 Codex 写代码,token 烧得最快的往往不是模型多能干,而是上下文管理不当。这篇文章从 Codex 的 agent loop、项目指令和 prompt 缓存机制讲起,给出一份能直接照做、也能度量效果的省 token 清单:什么时候开新会话、AGENTS.md 怎么瘦身、怎么选模型和推理档位、怎么监控自己的消耗。


Continue reading

Loop Engineering:别再手摇 AI 了,去设计那台摇柄

Posted on 五 12 6月 2026 in Tech • Tagged with loop-engineering, AI, agent, harness-engineering, claude-code, codex

过去两年,跟 AI 编程的姿势是"我打字、它回话",一个回合接一个回合。Loop Engineering 提出的新姿势是:你不再亲自下场提问,而是设计一个系统去替你问、去检查、去记笔记、去决定下一步该问什么。本文梳理这套思路的来龙去脉、五个零件加一块"备忘录"的结构、它在 Codex 和 Claude Code 里长什么样,以及它真正的难点为什么不在工具,而在"你还想不想当工程师"。


Continue reading

给 AI Agent 装个行车记录仪:用 Claude Code 和 Codex 的 Hook 追踪 Skill 调用

Posted on 一 01 6月 2026 in Tech • Tagged with AI Agent, Claude Code, Codex, Hooks, Observability, Skills

用 Claude Code 和 Codex CLI 各自官方的 hook 机制,把 AI Agent 调用 skill 的过程审计下来——什么时候触发了、传了什么参数、跑了多久,全留痕。给两家都给出可直接抄的配置。


Continue reading

给全栈程序员的 Codex 实战手册:别再只会写 Prompt 了

Posted on 四 14 5月 2026 in AI • Tagged with AI, Codex, AGENTS.md, hooks, rules, memories, full-stack, productivity

Codex 真正的生产力,不在于写一条神奇 Prompt,而在于把 AGENTS.md、rules、hooks、memories、skills 和 worktrees 组合成一套可重复、可验证、可演进的工程环境。


Continue reading

从 Cursor 迁到 Codex:别急着抄配置,先把脑回路迁过去

Posted on 四 23 4月 2026 in Tech • Tagged with Cursor, Codex, AGENTS.md, hooks, AI coding, workflow

很多人以为从 Cursor 迁到 Codex 只是把 .cursor/ 改成 .codex/,结果第一天就撞墙。真正难迁的不是目录,而是概念:Rules、Commands、AGENTS、Skills、Hooks、Sandbox、Approval 在两边的含义并不一样。结合官方文档和我在博客仓库里的真实迁移痕迹,聊聊怎么迁、先迁什么、哪些坑最容易踩。


Continue reading

给 Cursor、Codex、Claude Code 用的 AI Skill,到底该怎么测

Posted on 一 20 4月 2026 in Journal • Tagged with AI, Agent Skills, Cursor, Claude Code, Codex, Testing, Evaluation, CI

上一篇讲过用 promptfoo 测 LLM API 类的 AI skill。可咱们日常写的更多是另一种——给 Cursor、Codex、Claude Code 用的本地 skill,它没有 endpoint,没有固定 prompt,调用方是另一个 agent。这种 skill 该怎么测?本文给一套从结构 lint 到行为回归的完整方案。


Continue reading