Walter Fan's Blog

⭐ 推荐文章

大龄程序员尚能饭否 — 大龄程序员的自我审视
不要让快餐与短视频改变了我们 — 在碎片化时代保持清醒
从手搓 Workflow 到 LangGraph — AI 流程编排的两种路径
AI 时代，我为什么还要写作 — 写作是自娱自乐与表达欲
职场工具箱之 SCAMPER — 用 7 个动作把没想法变成有方案

用 Codex 怎么省 Token：账单别让上下文偷偷烧掉

Posted on 二 23 6月 2026 in Tech • Tagged with codex, ai, token, cost, context, productivity, agents-md

用 Codex 写代码，token 烧得最快的往往不是模型多能干，而是上下文管理不当。这篇文章从 Codex 的 agent loop、项目指令和 prompt 缓存机制讲起，给出一份能直接照做、也能度量效果的省 token 清单：什么时候开新会话、AGENTS.md 怎么瘦身、怎么选模型和推理档位、怎么监控自己的消耗。

LLM API 越来越贵，别让 token 像自来水一样哗哗流

Posted on 五 08 5月 2026 in Journal • Tagged with LLM, AI, token, cost-control, prompt-engineering, productivity

LLM API 的成本控制不是少用 AI，而是把 token 当工程资源来管。先度量，再分级选模型，压缩上下文，复用缓存，限制输出，离线任务走批处理，最后拿检查清单管住那些看不见的浪费。