DataSci Ocean
所有文章
標籤
分類
繁體中文
繁體中文
English
淺色
深色
系统預設
DataSci Ocean
取消
所有文章
標籤
分類
淺色
深色
系统預設
繁體中文
繁體中文
English
LLM Alignment
2024
解密 LLM 訓練三部曲:深入解析 SFT 與關鍵的 RLHF 技術
02-27
[論文介紹] DPO:Direct Preference Optimization
02-27