用 pgvector 做 RAG:别急着上 Pinecone,你的 PostgreSQL 就够了

Posted on Tue 10 March 2026 in AI • Tagged with RAG, pgvector, PostgreSQL, embedding, vector-search, Python, AI • 8 min read

你刚写完一个 RAG demo,跑通了 OpenAI embedding + Pinecone,兴奋了三秒——然后老板问你:"这个月 Pinecone 账单多少?"于是你开始重新审视那台已经跑了三年的 PostgreSQL。好消息:装个 pgvector 扩展,它就是你的向量数据库。这篇文章给你一套从 Docker 部署到 Python 完整代码的实操指南,跑完就能用。


Continue reading

如何打造个人与项目知识库:从全文搜索到 RAG,再到 Claude Skill

Posted on Thu 05 February 2026 in AI • Tagged with 知识库, 全文搜索, RAG, Claude-Code, Cursor, 写作方法 • 2 min read

很多人一上来就要“搞 RAG”,结果三天后变成“搞不下去”。真正能跑起来的知识库,往往从最土的全文搜索开始:先能找、再能用、最后才谈自动化。本文给一条可落地的路线:全文搜索 → 轻量 RAG → 把流程封装成 Claude Skill / Cursor command。


Continue reading

Prompt 工程已死,上下文工程当立

Posted on Fri 16 January 2026 in AI • Tagged with context-engineering, RAG, Personal Knowledge Base, LLM, AI-agent • 5 min read

你的 AI 回答总是不着边际?别再死磕 Prompt 了,多半是"上下文"没给对。本文深度解读"上下文工程",剖析它与 RAG 的本质区别,并通过一个"AI 面试官"的完整实例,手把手教你打造一个不弱智的 Agent。


Continue reading

RAG 进阶指南:别只盯着向量数据库,Elasticsearch 才是扫地僧

Posted on Thu 15 January 2026 in AI • Tagged with RAG, Elasticsearch, Vector Search, LLM, Hybrid Search • 3 min read

你的 RAG 系统总是在胡说八道?多半是检索拖了后腿。本文基于 Medium 高赞文章,深度解析如何利用 Elasticsearch 的混合检索、函数得分等高级特性,拯救你那“弱不禁风”的 RAG。


Continue reading