DataSci Ocean
所有文章
標籤
分類
繁體中文
繁體中文
English
淺色
深色
系统預設
DataSci Ocean
取消
所有文章
標籤
分類
淺色
深色
系统預設
繁體中文
繁體中文
English
Large Language Model
2026
別讓 AI 每次都從零開始!深度解析 ERL 框架:讓 LLM Agent 透過「單次反思」實現持續學習
04-10
掌握 Harness Engineering:結合 Ralph Loop 與 MemRL,打造具備持續學習能力的 AI Agent
04-05
告別長文本帶來的「智力退化」:WebResearcher 如何透過迭代研究架構超越 OpenAI?
04-02
不再需要微調!MemRL 如何讓 AI Agent 透過強化學習實現「自我進化」?
03-29
vLLM Semantic Router 重點介紹
03-29
UniversalRAG 深度解析:破解多模態 RAG 偏見,提升異質數據的檢索能力
03-25
賦予 AI 長效記憶:深入解析 AI Agent 的核心技術「上下文工程 (Context Engineering)」
03-22
別再只會寫 Prompt:深度解構 AI Agent 的系統工程學 —— 從 OpenClaw 看長效記憶與自主執行機制
03-16
為什麼你的 RAG 遇到表格就智商歸零?KDD 2026 頂會論文 MixRAG 帶來的破局之道
03-15
RAG 懂語義卻不懂時間?深入剖析 EMNLP 2025 的 MRAG 模組化檢索框架
03-10
面對模稜兩可的問題,AI 該學會反問:詳解 CLAM 論文與自動化 Oracle 評估機制
02-25
[EMNLP 2025] TableRAG 深度解析:表格不是拿來「讀」的,是用 SQL 來「查」的!
02-13
拒絕 AI 盲猜!NAACL 2025 論文詳解:教 LLM 學會「不懂就問」的 INTENT-SIM 演算法
02-08
RAG 架構大翻轉!MIT 新論文 ReDE-RF:不讓 LLM 寫作改當「裁判」,檢索速度暴增 10 倍
02-03
Google 2025 論文解讀:只要「複製貼上」就能變強?Prompt Repetition 如何成為 LLM 的免費午餐
01-19
RLHF 讓模型變無聊?揭秘「典型性偏差」與 Verbalized Sampling 如何喚醒 LLM 潛在的創造力
01-03
ACL 2025 | 超越 Self-Consistency!CER 論文解析:無需訓練,靠「過程自信度」激發 Llama 3 與 DeepSeek 推理潛能
01-03
2025
拒絕 AI 一本正經胡說八道!DeepConf 論文解析:如何利用「信心分數」優化推理並大幅節省 Token?
12-28
不微調、不靠 GPT-4!微軟 rStar 如何透過 MCTS 讓 LLaMA2-7B 數學能力暴增 5 倍? (ICLR 2025)
12-10
你的 Base Model 其實比你想的更聰明!揭秘如何透過 MCMC 採樣讓模型超越 RL
12-02
1
2
3