難點不在於發現論文很爛，而在於發現之後該如何應對

Lesswrong·大約 4 小時前

我認為評論研究的重點不應只是找出方法論上的瑕疵，而是要評估這些問題是否真的影響了論文核心主張的有效性。有效的評論應該建立在能準確總結原文的基礎上，並在批評之前先對模糊的選擇進行最強版本的解讀。

這篇文章是為 Inkhaven Residency 快速撰寫的。

我以前很討厭那句經典的管理格言：「帶解決方案來見我，而不是問題。」畢竟，識別問題是解決問題的第一步，而清晰地理解問題通常是解決難度中很大的一部分。（此外，我參加過許多現代管理課程，這些課程都將這句格言視為明顯錯誤且過時的說法，這也沒什麼幫助。）

但隨著時間推移，我意識到這句格言包含了一定程度的智慧，至少在研究的語境下是如此。有趣的問題很少在於某件事是否糟糕，而是在於它到底有多糟，以及之後該怎麼辦。

當我在國中和高中時，我熱衷於背誦邏輯謬誤，並在別人的論點中尋找它們。「那是訴諸權威！」我會在腦海中想著。「駁回！」（是的，我當時確實是個討人厭的辯論社小孩。）幸好，隨著年齡增長，我意識到弄清楚什麼才是事實通常更重要，而不是在想像或真實的辯論對手身上得分。辯論中真正有趣的問題通常是事實真相為何，而不是你能多有力地抨擊他人建構不良的論點。

在過去十年認識我的人通常會注意到，我對任何事物都傾向於持批判或懷疑態度。例如，我經常針對新發表的論文缺陷發表精彩的即興演講（不客氣的人可能會稱之為咆哮），其中一些甚至被轉化為部落格文章。我認為我的批評通常是正確的，並指出了論文中的真實問題。但在評論研究時，有趣的問題不在於一篇研究論文是否有令人質疑的方法論選擇（在足夠嚴格的審視下，所有論文都有），而是在於這些問題是否大到足以影響論文核心主張的有效性。通常，在進行進一步調查後，我會轉而認為，儘管一篇新論文存在嚴重的方法論問題，其核心主張仍然是正確的。

當我閱讀許多對論文的批評時，我看到了年輕時的自己：人們往往在閱讀論文時，發現一兩個問題就隨手將其屏棄。（這在 Twitter 上尤其常見，這也是我非常不喜歡使用它的主因。但遺憾的是，這在 AI 安全領域的人士中也屢見不鮮。）我認為這種現象的發生是可以理解的：深入調查一篇論文的主張需要時間和認知努力，而尋找一個破綻卻很廉價。通常，發現一個論文未處理的明顯方法論問題，可以作為作者缺乏學術工作量證明（academic proof-of-work）的證據。而且並非每篇論文都值得投入大量調查來完全理解：畢竟，不是每篇論文都有有趣的主張，且許多論文確實存在對其核心結論致命的嚴重方法論缺陷。但我仍然認為，評論應該花更多時間評估論文的核心主張，而不是尋找抨擊點。

為了提出一些解決方案（而不僅僅是指出問題），以下是在論文評論語境下可以遵循的一些良好準則：首先，我認為對論文的每一份評論至少應該對論文有足夠的理解，並能以作者認同的方式對其進行總結。其次，評論應很少糾結於拼字錯誤、格式錯誤或缺乏引用，且理想情況下應明確區分對核心主張致命的批評與非致命的批評。第三，在批評任何模糊的方法論選擇之前，評論應先對其進行「最強版本（steelmanning）」的解讀。

參與討論

https://lesswrong.com/posts/qcJ7eWQtREyKwwGEk/the-hard-part-isn-t-noticing-when-papers-are-bad-it-s