Fine-Tuning - 標籤 - DataSci Ocean

Fine-Tuning

2025

不只學「對」的，更要學「錯」的？深入解析 SENSE 如何用強弱 LLM 打造頂尖 Text-to-SQL 模型 (ACL 2024) 09-15

2024

[論文介紹] Tuning LayerNorm in Attention: Towards Efficient Multi-Modal LLM Finetuning 07-08

[論文介紹] Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM 04-24

[論文介紹] Sparse Upcycling: Training Mixture-of-Experts from Dense Checkpoints 04-10

解密 LLM 訓練三部曲：深入解析 SFT 與關鍵的 RLHF 技術 02-27

[論文介紹] DPO：Direct Preference Optimization 02-27

2023

VIME 論文精讀：用自監督學習，釋放你未標註表格資料的全部潛力 04-15