北京大學楊仝教授團隊近期發布了其在高效大型語言模型研究方向的一項新成果——FairyR1-32B模型。該模型基于DeepSeek-R1-Distill-Qwen-32B基座，通過結合微調與模型合并技術構建。研究探索了在參數量大幅減少的情況下，模型在特定任務上實現與更大模型相當甚至更優性能的可能性。該研究得到了國家自然科學基金委項目（624B2005, 62372009）的資助。FairyR1-32B模型已在huggingface開源：https://huggingface.co/PKU-DS-LAB/FairyR1-32B。

FairyR1-32B模型是在團隊前期TinyR1工作基礎上進行的進一步探索，沿用了“分合蒸餾”的研究思路，提出了多種改進方法，包括自我合并、多教師交叉蒸餾、輕蒸餾等方法，并在數據處理進行了優化，模型精度有了顯著提升。

本次工作重點改進了蒸餾數據的構建流程，對來源于AI-MO/NuminaMath-1.5（數學）和open-thoughts/OpenThoughts-114k（代碼）等數據集的原始數據，通過多個“教師模型”生成答案，隨后對問答數據進行精心篩選、結構調整與思維鏈優化，并進行多階段篩選。篩選過程包括基于答案的正確性驗證（針對數學數據），以及基于長度的篩選（數學數據保留2k-8k tokens范圍，代碼數據保留4k-8k tokens范圍），最終構建了更具針對性的約6.6k條數學數據和約3.8k條代碼數據用于訓練。

在模型結構方面，研究團隊嘗試訓練兩個領域（數學和代碼）的專業模型進行合并，旨在進一步優化流程和資源消耗。這兩個專業模型在一致的訓練參數下（例如相同的學習率和批次大小）獨立訓練約5個周期后，利用AcreeFusion工具進行了合并。在多個公開基準測試中，FairyR1展現出了在低參數量下的競爭力表現。以下為FairyR1與DeepSeek-R1-671B及DeepSeek-R1-Distill-Qwen-32B在部分基準上的得分對比：

從測試結果可以看出，FairyR1-32B在AIME 2025和LiveCodeBench基準上得分略高于DeepSeek-R1-671B，在AIME 2024上表現接近。在GPQA-Diamond科學基準上，FairyR1的得分低于DeepSeek-R1-671B。這些結果表明，FairyR1在采用DeepSeek-R1-Distill-Qwen-32B基座并經過特定技術處理后，能夠在約5%參數量的情況下，在數理和編程等領域實現與大型模型相當或略優的性能水平，但在科學等其他領域可能存在差距。這項工作探索了通過優化的數據處理和模型融合技術，在保證特定任務性能的前提下，大幅降低模型規模和潛在推理成本的可能性。

北京大學楊仝教授團隊表示：“FairyR1-32B模型是我們探索高效大型語言模型技術路線的階段性成果。通過對蒸餾和合并方法的改進，我們初步驗證了在有限資源下實現高性能模型的可行性。”

團隊成員：李旺、周俊廷、劉文睿、姚一倫、王融樂、楊仝

責任編輯：秦嵐嵐

THE END

消費界所刊載信息，來源于網絡，傳播內容僅以學習參考使用，并不代表本站觀點。本文所涉及的信息、數據和分析均來自公開渠道，如有任何不實之處、涉及版權問題，我們會及時處理，舉報投訴郵箱：Jubao_404@163.com，

本文地址: http://www.aaeedd.cn/Tech/63767.html

相關資訊

AI能力再進階，華為Mate XTs 非凡大師首發小藝知識庫功能

9月4日，HUAWEI Mate XTs 非凡大師正式發布，再展三折疊非凡。其系統級智能體小藝，AI能力再進階。在HUAWEI Mate XTs 非凡大師上...

2025-09-05

2025年MES軟件排行榜：8大知名品牌盤點

在當今制造業數字化轉型的浪潮中，MES（制造執行系統）軟件發揮著至關重要的作用，它就像企業生產運營的“智慧大腦”，連接著企...

2025-09-03

“識別準確又安全”的小藝輸入法聯名熱門IP，定制皮膚全新上線！

近日，小藝輸入法獲得華為常務董事、終端BG董事長余承東的高度稱贊。余承東表示，小藝輸入法“識別準確又安全”，其支持語音、翻...

2025-08-24

華為小藝AI競賽Agent首戰國際人工智能奧林匹克競賽（IOAI 2025）展現金牌實力

近期，第二屆國際人工智能奧林匹克學術活動（IOAI）在北京十一學校舉行。IOAI由麻省理工學院、牛津大學、哥本哈根大學、阿聯酋人...

2025-08-22

北大團隊提出2比特復數模型iFairy{±1, ±i}，精度反超量化前，可手機部署

version 8.14摘要：為破解大模型部署與推理成本高昂的困境，北京大學楊仝老師團隊首次提出名為iFairy的超低比特量化方案。該方案...

2025-08-15

【快訊】消費界成為第二屆中國（西安）國際低空經濟發展大會官方合作媒體

光伏三季度產量縮減開工率環比降10% 嚴查低價銷售

2025-06-19

美團天津設立閃豹科技公司

2025-06-19

消費界本網站所刊載信息，來源于網絡，僅供免費學習參考使用，并不代表本媒體觀點。本文所涉及的信息、數據和分析均來自公開渠道，如有任何不實之處、涉及版權問題，請聯系我們及時處理。本文僅供讀者參考，任何人不得將本文用于非法用途，由此產生的法律后果由使用者自負。

合作官方郵箱: hezuo@eeeck.com

投訴舉報郵箱：Jubao_404@163.com

招聘官方郵箱: rcrt@eeeck.com

關于

關于我們

商務合作

免責聲明

APP下載

Android | iOS

未經書面授權不得復制或建立鏡像，違者必究。

粵ICP備14076428號

老站長論壇便宜主機球球影院實用文檔化妝技巧頭像圖片北汽租車北京租車南昌中專學校氫氣汽車化妝技巧北汽租車 92綜合家族傳承大眾商報鋼琴譜市場觀察報北京租車建筑企業資質查詢口罩生產廠家數學計算器釣魚餌料網微生物菌劑太陽能殺蟲燈網站建設公司武漢安檢門 OLED透明屏泰國留學網艾奇寵物網農業儀器簡推淘站長圈親子鑒定親子鑒定商業時報低空經濟網