
你的檔案系統本身就是一個圖形資料庫
作者解釋了互連的 Markdown 檔案系統如何充當強大的圖形資料庫,並作為一種上下文工程系統,讓 AI 能夠基於真實的專案歷史而非片段資訊來產出更高品質的工作成果。
背景
本文探討如何利用檔案系統與 Markdown 格式,將個人知識庫轉化為大型語言模型(LLM)的上下文工程系統。作者延續 Andrej Karpathy 的觀點,主張透過 Obsidian 等工具建立的維基連結與資料夾分類,本質上就是一種圖形資料庫,能為 AI 提供極具深度的背景資訊,從而生成更精準的設計文件或決策分析。
社群觀點
針對將檔案系統視為圖形資料庫的觀點,社群展開了多層次的討論。支持者認為,這種做法的核心價值在於「上下文工程」。與其盲目地向 AI 提問,不如提供一個經過結構化整理、包含數月會議記錄與決策脈絡的資料夾。這種方式能讓 LLM 在具備真實歷史背景的情況下工作,產出的品質遠高於空泛的指令。部分開發者分享了實務經驗,例如利用特定的命名規範,讓檔案路徑能直接轉換為試算表數據,或透過腳本自動化處理發票與掃描檔的命名,進而簡化後續的資料處理流程。
然而,關於「結構化」的需求,社群內出現了顯著的分歧。有觀點質疑,既然 AI 具備強大的檢索與理解能力,人類是否還有必要維持嚴謹的資料夾分類。反對者認為,即便 AI 可以透過全文檢索或向量搜尋處理扁平化的檔案列表,人類依然需要結構化的分類來進行日常維護。檔案系統的階層設計不僅是為了 AI,更是為了在系統失效或需要人工介入時,人類仍能直觀地管理資料。若完全捨棄人類可讀的結構,將資料庫變成一堆雜亂的雜湊值檔案,將會喪失長期維護的穩定性。
此外,隱私與資料品質也是討論的焦點。許多使用者對於將私密的個人筆記上傳至雲端 AI 服務感到不安,因此積極尋求本地端模型的解決方案。雖然目前本地模型在處理複雜邏輯上仍與頂尖雲端模型有差距,但社群普遍達成一項共識:應限制 AI 僅負責組織與移動檔案,而非讓其大量撰寫筆記內容。過多由 AI 生成的文字會導致知識庫品質退化,形成一種自我循環的雜訊,最終降低系統的參考價值。
最後,關於檔案系統是否真能等同於圖形資料庫,技術層面上也引發了辯論。部分評論指出,傳統檔案系統本質上是樹狀結構,雖然透過符號連結或維基連結可以模擬圖形關係,但仍缺乏專業圖形資料庫所具備的索引優化與複雜路徑查詢功能。儘管如此,對於個人知識管理而言,這種基於純文字與檔案系統的架構,因其具備極高的可移植性與長久保存的特性,仍被視為對抗封閉式軟體與二進位資料庫格式的有力替代方案。
延伸閱讀
在討論過程中,參與者提到了一些實用的工具與資源。AS Notes 是一款針對 VS Code 開發的擴充功能,支援維基連結與任務管理,適合習慣在開發環境中管理筆記的使用者。此外,Tiago Forte 提出的 PARA 分類法被多次提及,作為建立知識庫結構的基礎框架。對於追求極致效能的開發者,也有人分享了利用 ext4 檔案系統的二進位樹特性來構建分散式資料庫的實驗性專案 root.rupy.se。