Walter Fan's Blog

⭐ 推荐文章

大龄程序员尚能饭否 — 大龄程序员的自我审视
不要让快餐与短视频改变了我们 — 在碎片化时代保持清醒
从手搓 Workflow 到 LangGraph — AI 流程编排的两种路径
AI 时代，我为什么还要写作 — 写作是自娱自乐与表达欲
职场工具箱之 SCAMPER — 用 7 个动作把没想法变成有方案

从传统 Wiki 到 AI 增强知识库

Posted on 五 29 5月 2026 in Tech • Tagged with LLM, Wiki, knowledge-base, RAG, AI, documentation, knowledge-management

我自己用 SQLite 写了一个传统 Wiki，链接靠手动维护。读了 llm_wiki 项目后，我没有推倒重来，而是决定吸收其精华，用 Python 写一个小工具来渐进增强。AI 是工人、咨询师、秘书，人才是知识库的主人。

RAG 知识库优化：别让 AI 一本正经地胡说八道

Posted on 五 08 5月 2026 in Journal • Tagged with RAG, AI, LLM, 知识库, 向量检索, 最佳实践

RAG 看起来不过是"先检索，再生成"，真正做起来才知道坑不少。分块、检索、重排序、Prompt、引用、评估，任何一环偷懒，最后都可能变成一个很自信的胡说八道机器。

AI 时代，别只囤笔记：我是怎么把知识库做成一部活的 Wiki

Posted on 三 22 4月 2026 in Tech • Tagged with AI, knowledge-base, wiki, PKM, RAG

AI 很强，但它并不了解你的项目、你的经历和你的判断。真正有用的知识库，不是把笔记堆起来，而是把原始材料、结构化页面、治理规则、来源与校验串成一条流水线。结合我最近折腾的一套私人原型，聊聊我是怎么搭自己的知识库，以及怎样让它不只是一个"仓库"。

CGM 论文讲了什么，咱们又该怎么落地

Posted on 二 21 4月 2026 in Journal • Tagged with CGM, Code Graph, LLM, RAG, SWE-bench, Repository, Ant Group, CodeFuse, 论文笔记

解读 arXiv:2505.16901(Code Graph Model): 这篇论文不是简单地做代码检索，而是把仓库建成一张"文本富图"，再把语义和结构一起送进模型。文末给出按投入递增的技术栈与落地路线图。

RRF 倒数排名融合：RAG 里那个看起来土、却一直没被换掉的小公式

Posted on 日 19 4月 2026 in Journal • Tagged with RAG, RRF, Reciprocal Rank Fusion, BM25, Vector Search, Hybrid Search, Reranker, Retrieval

RRF（Reciprocal Rank Fusion）是 RAG 检索里一个长得土、却几乎没人舍得换掉的小公式。不需要训练，不挑分数尺度，一行代码就能把 BM25 和向量检索揉到一起。本文把公式拆开，给一个手算例子，再聊聊它什么时候好用、什么时候该让位给 reranker。

给代码仓库造一个 DeepWiki：Tree-sitter + Embedding + 图谱 + LLM 的方法论

Posted on 四 16 4月 2026 in Journal • Tagged with RAG, Code Knowledge Base, Tree-sitter, Embedding, Memgraph, pgvector, sqlite-vec, LLM, DeepWiki, AI Coding

把一个陌生代码库变成可问可答的 DeepWiki 知识库，靠的不是"把 README 喂给 GPT"，而是 Tree-sitter 解析 + Embedding 向量 + 图数据库 + LLM 生成四件套。本文不谈具体实现代码，只讲方法论、流程与取舍，并进一步讨论：代码作为 source of truth 之后，文档如何分层，以及如何让知识库反过来 harness AI 编码。

Obsidian 加 LLM，个人知识库的正确打开方式

Posted on 三 08 4月 2026 in Journal • Tagged with Obsidian, LLM, 知识管理, AI, MCP, RAG

笔记散落各处，AI 却帮不了你？聊聊怎么用 Obsidian 的本地 Markdown 文件，配合 LLM 插件、MCP 和编译式知识库，把"一堆文件"变成"能回答问题的第二大脑"。

从 RAG 到 GraphRAG：当检索增强生成遇上知识图谱

Posted on 四 26 3月 2026 in tech • Tagged with graphrag, rag, knowledge-graph, llm, ai, leiden, community-detection

传统 RAG 在处理复杂多跳问题时力不从心，GraphRAG 通过引入知识图谱为检索增强生成带来了结构化推理能力。本文从痛点分析、核心架构、Leiden 社区检测算法到工程实践，全面深入剖析 GraphRAG。

用 pgvector 做 RAG：别急着上 Pinecone，你的 PostgreSQL 就够了

Posted on 二 10 3月 2026 in AI • Tagged with RAG, pgvector, PostgreSQL, embedding, vector-search, Python, AI

你刚写完一个 RAG demo，跑通了 OpenAI embedding + Pinecone，兴奋了三秒——然后老板问你："这个月 Pinecone 账单多少？"于是你开始重新审视那台已经跑了三年的 PostgreSQL。好消息：装个 pgvector 扩展，它就是你的向量数据库。这篇文章给你一套从 Docker 部署到 Python 完整代码的实操指南，跑完就能用。

如何打造个人与项目知识库：从全文搜索到 RAG，再到 Claude Skill

Posted on 四 05 2月 2026 in AI • Tagged with 知识库, 全文搜索, RAG, Claude-Code, Cursor, 写作方法

很多人一上来就要“搞 RAG”，结果三天后变成“搞不下去”。真正能跑起来的知识库，往往从最土的全文搜索开始：先能找、再能用、最后才谈自动化。本文给一条可落地的路线：全文搜索 → 轻量 RAG → 把流程封装成 Claude Skill / Cursor command。

Prompt 工程已死，上下文工程当立

Posted on 五 16 1月 2026 in AI • Tagged with context-engineering, RAG, Personal Knowledge Base, LLM, AI-agent

你的 AI 回答总是不着边际？别再死磕 Prompt 了，多半是"上下文"没给对。本文深度解读"上下文工程"，剖析它与 RAG 的本质区别，并通过一个"AI 面试官"的完整实例，手把手教你打造一个不弱智的 Agent。

RAG 进阶指南：别只盯着向量数据库，Elasticsearch 才是扫地僧

Posted on 四 15 1月 2026 in AI • Tagged with RAG, Elasticsearch, Vector Search, LLM, Hybrid Search

你的 RAG 系统总是在胡说八道？多半是检索拖了后腿。本文基于 Medium 高赞文章，深度解析如何利用 Elasticsearch 的混合检索、函数得分等高级特性，拯救你那“弱不禁风”的 RAG。