给代码仓库造一个 DeepWiki:Tree-sitter + Embedding + 图谱 + LLM 的方法论

Posted on 四 16 4月 2026 in Journal • Tagged with RAG, Code Knowledge Base, Tree-sitter, Embedding, Memgraph, pgvector, sqlite-vec, LLM, DeepWiki, AI Coding

把一个陌生代码库变成可问可答的 DeepWiki 知识库,靠的不是"把 README 喂给 GPT",而是 Tree-sitter 解析 + Embedding 向量 + 图数据库 + LLM 生成 四件套。本文不谈具体实现代码,只讲方法论、流程与取舍,并进一步讨论:代码作为 source of truth 之后,文档如何分层,以及如何让知识库反过来 harness AI 编码。


Continue reading

用 pgvector 做 RAG:别急着上 Pinecone,你的 PostgreSQL 就够了

Posted on 二 10 3月 2026 in AI • Tagged with RAG, pgvector, PostgreSQL, embedding, vector-search, Python, AI

你刚写完一个 RAG demo,跑通了 OpenAI embedding + Pinecone,兴奋了三秒——然后老板问你:"这个月 Pinecone 账单多少?"于是你开始重新审视那台已经跑了三年的 PostgreSQL。好消息:装个 pgvector 扩展,它就是你的向量数据库。这篇文章给你一套从 Docker 部署到 Python 完整代码的实操指南,跑完就能用。


Continue reading