用 Codex 怎么省 Token:账单别让上下文偷偷烧掉

Posted on 二 23 6月 2026 in Tech • Tagged with codex, ai, token, cost, context, productivity, agents-md

用 Codex 写代码,token 烧得最快的往往不是模型多能干,而是上下文管理不当。这篇文章从 Codex 的 agent loop、项目指令和 prompt 缓存机制讲起,给出一份能直接照做、也能度量效果的省 token 清单:什么时候开新会话、AGENTS.md 怎么瘦身、怎么选模型和推理档位、怎么监控自己的消耗。


Continue reading

LLM API 越来越贵,别让 token 像自来水一样哗哗流

Posted on 五 08 5月 2026 in Journal • Tagged with LLM, AI, token, cost-control, prompt-engineering, productivity

LLM API 的成本控制不是少用 AI,而是把 token 当工程资源来管。先度量,再分级选模型,压缩上下文,复用缓存,限制输出,离线任务走批处理,最后拿检查清单管住那些看不见的浪费。


Continue reading