
2025年大型語言模型研究論文清單(7月至12月)
Sebastian Raschka'S Blog·
這篇文章提供了一份經過整理與分類的2025年下半年重要大型語言模型研究論文清單,涵蓋了從推理模型到高效訓練等各項主題。
LLM 研究論文:2025 年清單(7 月至 12 月)
在六月,我與支持本 Substack 的付費訂閱者分享了一篇額外文章,內容是我精心挑選並收藏的研究論文清單。
同樣地,為了感謝所有熱心支持者,我準備了下方這份清單,列出了我在 2025 年 7 月至 12 月期間收藏並分類的有趣研究文章。
我瀏覽了這些論文的摘要,但只閱讀了其中極小部分。儘管如此,我仍然喜歡持續收集這些整理好的清單,因為在執行特定專案時,我經常會回頭參考它們。
順帶一提,我也一直在撰寫年度 LLM 回顧文章《2025 年 LLM 現況:進展、問題與預測》,該文也在今天發布。您可以在這裡找到它:
2025 年 LLM 現況:進展、問題與預測
原先,我計劃將此清單包含在上述文章中。然而,該文章篇幅已經相當長,因此我決定將清單放在這篇獨立的文章中分享。希望您不介意今天收到兩封郵件。我的想法是,將內容分開會使兩篇文章都更容易閱讀、瀏覽,並方便日後重新查閱,而不會迷失在過長的頁面中。
此研究論文清單的分類如下(您可以使用本文網頁版中的目錄直接跳轉至各分類):
推理模型
1a. 訓練推理模型
1b. 推理階段(Inference-Time)推理策略
1c. 評估 LLM 及/或理解推理能力
其他 LLM 強化學習方法
其他推理階段擴展(Inference-Time Scaling)方法
模型發布 / 技術報告
架構
高效訓練
基於擴散模型(Diffusion-Based)的語言模型
多模態與視覺語言模型
數據與預訓練數據集
本文僅限付費訂閱者閱讀
相關文章