
常見研究建議之二:精確表達你的核心觀點
我強調在研究寫作與圖表中明確表達核心觀點的重要性,同時也提醒要避免過度簡化而導致刪除必要的背景資訊。
本文為 Inkhaven Residency 計畫 的一部分。
如前所述,我提供給較資深研究合作者的研究回饋通常屬於以下三類之一:
- 進行快速的常識檢查(Sanity checks)
- 精確地說出你想表達的內容
- 再問一次「為什麼」
在每一種情況下,我認為這些建議都可能被推向我不再認同的極端。因此,我試著詳細說明你應該執行這些建議的程度,以及「做得太過頭」可能會是什麼樣子。
我在前一篇文章中談到了進行快速的常識檢查。在這裡,我要談談第二條建議:精確地說出你想表達的內容。
精確地說出你想表達的內容
第二常見的回饋是,你應該精確地寫下你想表達的內容。
我與初級研究人員最常見的互動之一如下:我閱讀了他們研究報告的草稿章節。這通常由許多段落組成,詳細描述了各種看似不相關的想法,以及 5 到 10 個不同的圖表。我對該章節的重點感到困惑。我問他們在這一節到底想表達什麼。他們給了我一個非常精闢且簡潔的陳述,說明讀者應該學到什麼。我建議他們應該把那句話寫下來,並顯眼地放在該章節的某處。
有時候,問題在於人們不知道自己想表達什麼觀點。但大約有一半的時間,與我交談的人已經知道他們想透過一段文字表達什麼——他們只是沒有在該章節的任何地方說出那個重點!
這裡的建議很簡單:弄清楚你想表達什麼觀點,並將其顯眼地呈現出來。舉例來說,如果你的部落格文章主要主張是 AI 模型在公開部署前可能具有危險性,那麼考慮將標題定為類似 「AI 模型在公開部署前可能具有危險性」,或者至少在引言中用同樣的字眼清晰地說明。
與此相對的是,你不應該包含會分散你想表達內容的文字(或者至少將其降級到腳本、附錄或括號中)。在作品中增加內容總是誘人的,而刪減幾乎總是困難的(因此常有「沒時間寫出更短篇幅」的自嘲)。
這條建議及其反面同樣適用於圖表:在說出你想表達的內容方面,簡單的修正通常是在圖說中強調圖表的相關部分。更好的做法是在圖表本身中強調你的主張:例如,如果你的主張是較長的思維鏈(Chain-of-thought)更具可監控性,那麼考慮包含一個以思維鏈長度為 x 軸、可監控性為 y 軸的回歸圖。
**
如果你主張疫苗能有效降低麻疹的發病率,那麼考慮製作一張麻疹病例隨時間變化的熱點圖,並清晰地標出疫苗引入的日期。這張圖來自《華爾街日報》的文章「對抗 20 世紀的傳染病:疫苗的影響」,不過我最初是在 Edward Tufte 的書《以新眼光觀察:意義、空間、數據、真相》中看到這個例子的。^([1])
在不包含不必要內容方面,第一步是避免 Edward Tufte 所說的「圖表垃圾」(chartjunk):即圖表中對於理解所呈現資訊並非必要,或會分散觀眾注意力的視覺元素。第二步也是更困難的一步,是削減不必要的資訊。例如,你可能會平均 AI 模型在各項任務中的表現,而不是為每個任務包含一個數據點。
左圖:包含大量圖表垃圾的圖表範例,包括不必要的陰影、冗餘文字和不必要的圖例。右圖:去除上述圖表垃圾後的同一張圖。這個範例最初來自 Darkhorse analytics,不過你可以在這個 Github 儲存庫找到開源的重製版。
資訊密集是可以接受的,只要關鍵主張仍然可以從圖表中讀取出來(或者如果資訊包含在另一個單獨的圖表中)。
做得太過頭。 不幸的是,什麼是必要的、什麼是多餘的垃圾通常取決於判斷,而且很容易將這條建議執行得太過火。
在散文方面,你的關鍵主張通常需要大量的額外背景才能理解:如果你發現人們無法理解你的主要主張,或者存在你尚未回答的明顯後續問題,請考慮將額外的背景加回去。即使是純粹的冗餘也有其作用:讀者通常是粗略瀏覽你的作品或分段閱讀,因此任何你真正希望他們記住的重點,都應該整合到作品的不同部分。
對於圖表,「移除不必要內容」的極端版本是最終得到一個沒有論據、基本上只是斷言的圖表。經典例子是商業 PowerPoint 中常見的無內容圖表——雖然這些圖表通常具有數據支撐圖表的一些特徵,但它們並非基於真實數據製作,也不包含足以證明其佔用空間合理性的內容。如果你發現圖表的全部內容可以用一句話概括,那麼你可能刪減了太多內容(或者最好直接用文字說出那句話,或許再搭配另一張圖表!)。
孫正義試圖為 WeWork 使用一個假設性的獲利軌跡(既非基於真實數據,甚至沒有 y 軸基準)來證明軟銀對該公司投資的合理性,而當時該公司已讓軟銀損失了數十億美元。來源。
- ^(^) 順帶一提,我認為使用「顏色」作為第三維度通常能產生更具可讀性的圖形,也就是說,熱點圖通常優於 3D 圖表。