DataSci Ocean
所有文章
標籤
分類
繁體中文
繁體中文
English
淺色
深色
系统預設
DataSci Ocean
取消
所有文章
標籤
分類
淺色
深色
系统預設
繁體中文
繁體中文
English
Fine-Tuning
2025
不只學「對」的,更要學「錯」的?深入解析 SENSE 如何用強弱 LLM 打造頂尖 Text-to-SQL 模型 (ACL 2024)
09-15
2024
[論文介紹] Tuning LayerNorm in Attention: Towards Efficient Multi-Modal LLM Finetuning
07-08
[論文介紹] Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM
04-24
[論文介紹] Sparse Upcycling: Training Mixture-of-Experts from Dense Checkpoints
04-10
解密 LLM 訓練三部曲:深入解析 SFT 與關鍵的 RLHF 技術
02-27
[論文介紹] DPO:Direct Preference Optimization
02-27