探索 SQL-of-Thought 如何透過創新的多代理人(Multi-Agent)框架,提升大型語言模型(LLM)處理 Text-to-SQL 的準確率。本文將深入解析其獨特的代理人工作流,以及如何利用「SQL 錯誤分類法」進行引導式錯誤修正,產生更精準的 SQL 查詢。
還在煩惱 RAG 的 k 值該設多少嗎?本文介紹最新的 Adaptive-k 方法,能為每次檢索動態決定最佳 k 值,有效提升 LLM 回答品質,同時不增加推理延遲。
想了解如何提升 Text-to-SQL 模型表現嗎?本文深入解析 ACL 2024 的 SENSE 論文,看它如何巧妙利用強、弱大型語言模型 (LLM) 生成合成資料,並結合 SFT 與 DPO 兩階段訓練,讓開源模型的 SQL 生成能力達到頂尖水準。
FastAPI 中共用全域變數會導致 Race Condition 嗎?本文深入探討 FastAPI 的多執行緒與 Async 機制,解析 Thread-Safe 與 Async-Safe 的關鍵差異,並教你如何避免死鎖、寫出真正安全的並行程式碼。
本篇文章介紹 MIRIX Agent 論文,理解 MIRIX Agent 設計了哪 6 種 Memory Component 以及如何透過 Memory 更新以及對話 Workflow 在 LOCOMO 資料集上達到 SOTA 的表現。
本篇文章介紹 Decoupled Planning and Execution: A Hierarchical Reasoning Framework for Deep Search 論文。本篇論文針對 Deep Search 的技術提出了一個 Planner-Coordinator-Executor 的模式。相較於常見的 Planner-Executor 模式,我認為 Coordinator 的設計是本篇論文的亮點之一。透過 Coordinator 優化了 Executor 回傳給 Planner 的執行結果的資訊,也透過 Memory Mechanism 來提昇 Executor 之間資訊的傳遞。在實驗結果上,也可以看到 HiRA 相較於 Strong Baseline WebThinker 有更好的表現。
本篇文章介紹 Augmenting LLM Reasoning with Dynamic Notes Writing for Complex QA 論文。NotesWriting 的目標在於減少 Multi-Hop RAG 中,由於進行多次的 Retrieval,使得過多不相關資訊進入到 LLM Context 中,而使得 LLM 表現變差的問題。NotesWriting 針對每個 Retrieved Document 進行 Notes Extract,再將所有 Extract 出來的 Note 進行 Aggregation,得到最終少量且重要的資訊,來提昇 LLM Context 的品質進而提昇 LLM 的表現。