2025年大型語言模型研究論文清單（7月至12月）

Sebastian Raschka'S Blog·4 個月前

這篇文章提供了一份經過整理與分類的2025年下半年重要大型語言模型研究論文清單，涵蓋了從推理模型到高效訓練等各項主題。

LLM 研究論文：2025 年清單（7 月至 12 月）

在六月，我與支持本 Substack 的付費訂閱者分享了一篇額外文章，內容是我精心挑選並收藏的研究論文清單。

同樣地，為了感謝所有熱心支持者，我準備了下方這份清單，列出了我在 2025 年 7 月至 12 月期間收藏並分類的有趣研究文章。

我瀏覽了這些論文的摘要，但只閱讀了其中極小部分。儘管如此，我仍然喜歡持續收集這些整理好的清單，因為在執行特定專案時，我經常會回頭參考它們。

順帶一提，我也一直在撰寫年度 LLM 回顧文章《2025 年 LLM 現況：進展、問題與預測》，該文也在今天發布。您可以在這裡找到它：

原先，我計劃將此清單包含在上述文章中。然而，該文章篇幅已經相當長，因此我決定將清單放在這篇獨立的文章中分享。希望您不介意今天收到兩封郵件。我的想法是，將內容分開會使兩篇文章都更容易閱讀、瀏覽，並方便日後重新查閱，而不會迷失在過長的頁面中。

此研究論文清單的分類如下（您可以使用本文網頁版中的目錄直接跳轉至各分類）：

推理模型

1a. 訓練推理模型

1b. 推理階段（Inference-Time）推理策略

1c. 評估 LLM 及/或理解推理能力

其他 LLM 強化學習方法

其他推理階段擴展（Inference-Time Scaling）方法

模型發布 / 技術報告

架構

高效訓練

基於擴散模型（Diffusion-Based）的語言模型

多模態與視覺語言模型

數據與預訓練數據集