Featured image for 你的 Base Model 其實比你想的更聰明！揭秘如何透過 MCMC 採樣讓模型超越 RL

你的 Base Model 其實比你想的更聰明！揭秘如何透過 MCMC 採樣讓模型超越 RL

Hong-Wei Wu 發佈於 2025-12-02 收錄於論文介紹

深入解析《Reasoning with Sampling》論文，揭秘如何透過 MCMC 採樣與分佈銳化 (Distribution Sharpening)，讓 Base Model 不需強化學習 (RL) 也能展現驚人推理能力。探索 Inference-time Compute 如何以時間換取智能，解鎖模型隱藏潛力。

Featured image for AI 的下一步：Agentic Context Engineering，讓你的模型學會思考與進化

AI 的下一步：Agentic Context Engineering，讓你的模型學會思考與進化

Hong-Wei Wu 發佈於 2025-10-27 收錄於論文介紹

想知道如何讓大型語言模型 (LLM) 自我進化嗎？本文深入解析最新研究 Agentic Context Engineering (ACE)，看它如何透過創新的脈絡工程，解決 Context Collapse 與 Brevity Bias 兩大難題，打造更聰明、持續進步的 AI 系統。

Featured image for AI 如何邊工作邊學習？深入解析《Dynamic Cheatsheet》的自我提升之道

AI 如何邊工作邊學習？深入解析《Dynamic Cheatsheet》的自我提升之道

Hong-Wei Wu 發佈於 2025-10-15 收錄於論文介紹

如何讓 LLM 在上線後還能不斷學習進化？本文介紹《Dynamic Cheatsheet》的關鍵技術，理解其如何透過 Adaptive Memory 與 Retrieval 技術，實現一個簡單卻強大的 Self-Improving LLM。

Featured image for 讓 AI 學會自我除錯！深入了解 SQL-of-Thought 如何打造更精準的 Text-to-SQL

讓 AI 學會自我除錯！深入了解 SQL-of-Thought 如何打造更精準的 Text-to-SQL

Hong-Wei Wu 發佈於 2025-10-12 收錄於論文介紹

探索 SQL-of-Thought 如何透過創新的多代理人（Multi-Agent）框架，提升大型語言模型（LLM）處理 Text-to-SQL 的準確率。本文將深入解析其獨特的代理人工作流，以及如何利用「SQL 錯誤分類法」進行引導式錯誤修正，產生更精準的 SQL 查詢。

Featured image for 告別固定的 Top-k！Adaptive-k 如何在不增加延遲下，為 RAG 動態選出最佳上下文

告別固定的 Top-k！Adaptive-k 如何在不增加延遲下，為 RAG 動態選出最佳上下文

Hong-Wei Wu 發佈於 2025-09-22 收錄於論文介紹

還在煩惱 RAG 的 k 值該設多少嗎？本文介紹最新的 Adaptive-k 方法，能為每次檢索動態決定最佳 k 值，有效提升 LLM 回答品質，同時不增加推理延遲。

Featured image for 不只學「對」的，更要學「錯」的？深入解析 SENSE 如何用強弱 LLM 打造頂尖 Text-to-SQL 模型 (ACL 2024)

不只學「對」的，更要學「錯」的？深入解析 SENSE 如何用強弱 LLM 打造頂尖 Text-to-SQL 模型 (ACL 2024)

Hong-Wei Wu 發佈於 2025-09-15 收錄於論文介紹

想了解如何提升 Text-to-SQL 模型表現嗎？本文深入解析 ACL 2024 的 SENSE 論文，看它如何巧妙利用強、弱大型語言模型 (LLM) 生成合成資料，並結合 SFT 與 DPO 兩階段訓練，讓開源模型的 SQL 生成能力達到頂尖水準。

Featured image for FastAPI 的並行陷阱：從 Race Condition 到 Deadlock，徹底搞懂全域變數的正確用法

FastAPI 的並行陷阱：從 Race Condition 到 Deadlock，徹底搞懂全域變數的正確用法

Hong-Wei Wu 發佈於 2025-08-31 收錄於其他主題

FastAPI 中共用全域變數會導致 Race Condition 嗎？本文深入探討 FastAPI 的多執行緒與 Async 機制，解析 Thread-Safe 與 Async-Safe 的關鍵差異，並教你如何避免死鎖、寫出真正安全的並行程式碼。

1
2
3
7