2025年大型語言模型研究論文清單(7月至12月)

2025年大型語言模型研究論文清單(7月至12月)

Sebastian Raschka'S Blog·

這篇文章提供了一份經過整理與分類的2025年下半年重要大型語言模型研究論文清單,涵蓋了從推理模型到高效訓練等各項主題。

LLM 研究論文:2025 年清單(7 月至 12 月)

在六月,我與支持本 Substack 的付費訂閱者分享了一篇額外文章,內容是我精心挑選並收藏的研究論文清單。

同樣地,為了感謝所有熱心支持者,我準備了下方這份清單,列出了我在 2025 年 7 月至 12 月期間收藏並分類的有趣研究文章。

我瀏覽了這些論文的摘要,但只閱讀了其中極小部分。儘管如此,我仍然喜歡持續收集這些整理好的清單,因為在執行特定專案時,我經常會回頭參考它們。

順帶一提,我也一直在撰寫年度 LLM 回顧文章《2025 年 LLM 現況:進展、問題與預測》,該文也在今天發布。您可以在這裡找到它:

2025 年 LLM 現況:進展、問題與預測

原先,我計劃將此清單包含在上述文章中。然而,該文章篇幅已經相當長,因此我決定將清單放在這篇獨立的文章中分享。希望您不介意今天收到兩封郵件。我的想法是,將內容分開會使兩篇文章都更容易閱讀、瀏覽,並方便日後重新查閱,而不會迷失在過長的頁面中。

此研究論文清單的分類如下(您可以使用本文網頁版中的目錄直接跳轉至各分類):

推理模型

1a. 訓練推理模型

1b. 推理階段(Inference-Time)推理策略

1c. 評估 LLM 及/或理解推理能力

其他 LLM 強化學習方法

其他推理階段擴展(Inference-Time Scaling)方法

模型發布 / 技術報告

架構

高效訓練

基於擴散模型(Diffusion-Based)的語言模型

多模態與視覺語言模型

數據與預訓練數據集

本文僅限付費訂閱者閱讀

Sebastian Raschka'S Blog

相關文章

  1. 2025 年大型語言模型研究論文清單(1 月至 6 月)

    10 個月前

  2. 大型語言模型研究論文:2025年上半年清單

    10 個月前

  3. 大型語言模型研究論文:2025年下半年清單 (七月至十二月)

    4 個月前

  4. 2025年大型語言模型現狀:進展、問題與預測

    4 個月前

  5. 提升推理模型能力的推論端運算縮放方法

    大約 1 年前