投入、產出與價值成果

Lesswrong·20 天前

原文

這篇文章探討了不同職業中投入、產出與價值成果之間的區別，並強調了誘因失調如何導致無效工作以及落入古德哈特定律的陷阱。

本文基於與 Jukka Tykkyläinen 和 Kimmo Nevanlinna 的對話。原始框架和許多觀點皆承襲自他們。

你可以將任何工作視為包含「投入」（inputs）、「產出」（outputs）和「價值成果」（valued outcomes）。

投入通常是你花在做某件特定事情上的時間，以及你需要的任何物質資源。產出是你所做之事的直接結果。價值成果則是最初你被付薪水去做這份工作的原因。

在許多工作中，這三者是緊密相連的：

挖隧道

投入： 花在挖隧道上的時間
產出： 挖出的隧道長度
成果： 一條讓人們可以穿越某處的隧道^([1])

繁忙商店的收銀員

投入： 花在服務顧客上的時間
產出： 服務過的顧客數量
成果： 對顧客的銷售額

托育服務

投入： 花在照顧孩子上的時間
產出： 花在照顧孩子上的時間
成果： 孩子們在這段時間內，至少過得不比之前差

它們並非完全相同。你可能在工作上花了大量時間但做得不好（懶散地挖、刷錯商品、對孩子疏忽或虐待）。但假設你試圖做好一份合理的工作且並非極度無能，通常只要準時出現並工作一定的時數，就能把事情辦好。

在其他工作中，這三者則有所不同：

B2B 電子郵件行銷

投入： 花在給潛在客戶寫郵件的時間
產出： 發送給潛在客戶的郵件數量
成果： 獲得新客戶

僅僅發送任何郵件是不夠的；你必須發送優質的郵件才能真正贏得客戶。事實上，寫一封真正優質的郵件可能比寫一百封爛郵件更好。

科學研究

投入： 花在研究上的時間，可能的物質支出
產出： 研究論文、會議簡報、部落格文章等
成果： 推動人類知識邊界的創新貢獻

你有可能累積大量乏味但因某種原因仍被引用的出版物，而這實際上並未對產生任何真正的知識做出貢獻。

在第二類工作中，至少有兩點不同：

1. 產出與價值成果之間的聯繫變得弱得多。 你可能真的盡了最大努力產出許多真實的產出，並投入了大量心血。但它們仍可能完全無法產生任何價值成果。

2. 由於產出與價值成果之間的聯繫減弱，變得更難判斷你何時做得不好，甚至你可能因為做得不好而積極獲得獎勵。 在前一類工作中，你可能花了大量時間工作卻未能產生價值，但這通常相對明顯。一個從收銀機偷錢的銷售員可能因為擅長隱藏而不易被察覺，但至少每個人都知道銷售員不應該偷竊。

相比之下，如果你無法直接衡量什麼能帶來價值成果，但仍需要獎勵表現，就很容易陷入古德哈特定律（Goodhart’s Law）。人們可能會因為你擁有大量與價值成果脫節的產出而積極獎勵你。

例如，招聘和撥款委員會可能會評估研究人員擁有多少論文和引用次數。這鼓勵了極大化出版物數量，例如將單項研究拆分成盡可能多的獨立論文，而不是只寫一篇真正優秀且全面的論文。獎勵過程正積極地將研究人員推離那種能產生價值的工作。

人們也可能因為具有真正價值的產出而獲得獎勵，但其方式卻忽略了達成價值成果所需的其他要素。例如，某人可能因個人貢獻而獲得獎勵，但幫助其他團隊成員卻得不到功勞，即使對他們來說專注於此會更有價值。

從中得出「永遠專注於成果」的結論可能很誘人。

但是。

對你而言的價值成果，可能與雇用你的人所認定的價值成果不同。也許你認為公司正在做一些無用的事，或者它的組織方式使得你個人的貢獻毫無用處。例如，你正在撰寫永遠不會被閱讀的報告。或者管理層不斷更改計劃，所以你剛剛完成的任何工作通常都會為了最新的點子而被丟棄。

對你來說，價值成果只是拿到薪水，而你的薪水與你工作的價值並不掛鉤。事實上，即使你認為公司正在做有價值的事，且你可以做一些有價值的事……如果你的評估和晉升是基於獎勵錯誤事物或未能獎勵正確事物的指標，你的薪水仍可能與你工作的價值呈負相關。

在這種情況下，專注於任何能讓你升職的成果會更有意義。也許這無法促進公司的利益，但那是公司沒有開發出更好激勵結構的問題。

許多公司甚至可能不希望基於基層員工思考成果。他們只希望基層員工準時出現並照吩咐做事，而不是試圖改變既定程序。那麼你可能會遇到這樣的情況：基層員工在意投入（「我們來上班，混夠時間」），中層管理在意產出（「讓員工達成這些指標」），而高層主管在意成果（「讓我們設定這些預期能帶來利潤的指標」）。

對於使用公共資金領域的研究人員來說，這個論點感覺有所不同。在這些領域中，即使激勵機制很糟糕，也有更強的理由專注於成果。「學術界」沒有一個單一的決策者可以為激勵機制負責，且工作應該造福整個公眾。原則上，如果你不願意做真正具有科學價值的事，你根本不應該留在這個領域。

在實踐中，現實也可能是個人有學生貸款和家庭要養，在這種情況下，他們需要玩這場激勵遊戲以維持收入。

一些相關的問題是「你最初為什麼進入這個領域？」以及「大眾對你的普遍期望是什麼？」。如果你在一家大公司工作只是為了謀生，那麼只專注於任何能讓你賺錢的事，並讓管理層去煩惱如何最好地激勵你做好工作，這是合理的。如果你在學術界、醫院、消防隊或非營利組織工作，且真心想要行善——你可能仍需應對激勵結構的現實，但不應忘記工作的真正目的。

哲學家 C. Thi Nguyen 在一次訪談中說道：

我進入哲學領域是因為我熱愛關於生命意義、萬物為何存在以及事物為何美麗等古怪、有趣的問題。然後我進入了哲學研究所並被社會化了。在哲學界，有一種透過調查整理出的地位排名，衡量你發表的期刊地位以及你所在的系所。當你進入研究所時，你對這些一無所知。你覺得哲學很酷，你想思考生命的意義。然後幾乎每個人出來時都變成：我排名最高的出版物是什麼？我工作的排名是多少？這發生了轉變。[...]

我變得執著於提升排名，開始寫一些讓我感到無聊的哲學。然後我想死。在某個時刻，我處於某個地方，心想：我做出了人生中最古怪的決定，那就是放棄任何可能的經濟回報——不當律師、離開矽谷、投身於這個古怪愚蠢的職業，唯一可能從事它的理由就是出於熱愛。然而不知何故……我發現自己為了在這個內部排名系統中攀升，正在寫著我討厭的無聊哲學。然後我心想，我想這是我常有的一種原始反應，就像是：發生了什麼事？我們在這裡做什麼？

有時當我對工作感到沮喪時，是因為我期望或希望我的投入等於產出，但事實並非如此。

這看起來可能是：我有一段時間沒寫部落格文章了，我覺得我應該很快出一篇。我在想，「讓我坐下來寫一篇文章吧」。我希望體驗到的是那種單純寫作並穩定進步，直到完成文章的感覺。

但事情並沒有那樣發展。我發現我的點子行不通，必須重新思考，而我不知道這需要多長時間，而不是能直接坐下來寫。花所有時間思考確實是進步，但通常感覺不像進步，因為沒有明確的「數字上升」能讓進步變得具體。

或者更確切地說，花所有時間思考可能是進步。但也可能花了很多時間思考某件事卻依然卡住；投入並沒有轉化為多少產出。這也是為什麼這會讓人感到壓力：你無法預先區分「我花了很多時間思考這件事，然後取得了寶貴的進步」與「我花了很多時間思考這件事，而大部分時間實際上都被浪費了」。

如果某件事的進展確實很緊迫，卻沒有轉化為具體的產出，那麼感到沮喪和絕望可能是理性的。這意味著某些方法行不通，你切換策略到能產生更快進展的方法可能會做得更好。（某些 AI 的一種失敗模式是永遠不會感到沮喪，然後一遍又一遍地嘗試同樣無用的方法。）

@AnnaSalamon 和 @Duncan Sabien (Inactive) 有一篇關於為什麼新創公司創始人會有情緒波動的老文章——情緒在一天之內從「我有史以來最棒的產品」翻轉到「我的產品糟透了，永遠不會成功」。他們指出，其他可能導致這種波動的情況包括：

處於第一段認真戀愛關係初期的人（尤其是那些非常非常非常想讓它成功，但缺乏清晰模式的人）
那些深切嚴肅地想要在解決全球貧困、太空探索、生存風險或其他世界級問題上做出貢獻的人
那些掙扎著寫第一本小說、拍第一部電影、畫第一幅傑作或贏得第一枚金牌的人

他們假設所有這些都有一個共同原因：高壓以及對於到底該做什麼的極度不確定。用他們的話說：「不僅是不確定該走哪條路，還不確定這些路（以及目的地！）是否真實存在」。

用這篇文章的語言來說，就是不確定為了達成價值成果應該瞄準什麼樣的投入和產出，有時甚至不確定價值成果到底是什麼。簡而言之，我稱之為「缺乏清晰度」。

有些人並非在做什麼高風險的事，但當不清楚該做什麼時仍會感到壓力。就此而言，也並非每個人都覺得他們的第一次重大藝術嘗試特別令人壓力山大。通常當我因為在特定時間內沒有取得足夠進展而感到壓力時，並沒有任何客觀理由——我只是對自己提出了很高的要求，然後當我覺得自己未能達到要求時感到壓力。

因此，一個人處理缺乏清晰度的能力，既與個人的模糊容忍度有關，也與他們面臨的外部壓力大小有關。

那麼，被三者之間聯繫清晰直接的事物所吸引是合理的。這意味著總是很容易知道該做什麼，並且將最多的時間和精力花在有價值的事情上。對它們聯繫薄弱感到沮喪是真實的信息——如果它們能清晰聯繫，且一個人可以只針對一件事進行優化，那確實會更好。

AI 和機器學習在那些你有明確目標變量，並能將系統的所有優化能力釋放在這些變量上的任務中也表現得最好。當系統能獲得關於其所有行動如何反映在感興趣的變量上的清晰回饋時，它就能迅速迭代出產生最佳成果的行動。

同樣地，許多遊戲之所以令人愉快，是因為產出和價值成果的聯繫非常清晰。如果你在射擊敵人，而擊殺數最多的玩家獲勝，那麼弄清楚該做什麼就非常簡單。你只需專注於尋找執行它的最佳方式。

正如這所暗示的，對清晰度的渴望不僅影響人們的工作，也影響他們的愛好。雖然人們可能對自己的愛好沒有明確的目標，但他們可能喜歡諸如變得更擅長之類的事——或者認為自己喜歡。像是關於專業技能的謬誤 10,000 小時法則——「練習一項技能 10,000 小時就能成為大師」——之所以流行，部分原因可能是它暗示了時間投入與精通成果之間的直接關係。這個想法是：只要堅持做一件事，你就會變得出色。

就像工作一樣，在某些愛好中，價值成果與投入和產出的聯繫比其他愛好更直接。舉重時間、你能舉起的重量以及你的肌肉量之間有著相當緊密的聯繫。而對於寫出好的小說或有趣的論文這類事情，情況則要主觀和模糊得多。

我以前從事 AI 策略研究，但我發現這非常具有挑戰性，原因有很多，包括缺乏清晰度。我想做能防止世界被失控的 AI 毀滅的研究，但沒辦法知道到底什麼才會有助於此。我大部分時間都覺得把這件事做對至關重要，同時也因猶豫不決而癱瘓。最終，我辭職去做了些更容易的事。

但我仍然希望為世界變得更好做出貢獻，儘管這是一個模糊的目標。考慮到 AI 最近取得的進展，我確實想以某種方式確保事情朝著積極的方向發展。

而且，仍然不可能知道什麼對此真正有用。

所以我的目標一直是：嘗試定期撰寫部落格文章。不只是關於 AI，而是關於任何我碰巧覺得有趣的事情。如果我不能完全阻止世界被毀滅，也許我至少可以在我們還活著享受它時，讓它變得稍微好一點。

在這裡，關於瞄準什麼樣的產出的問題變得有趣了。

我一直以每月至少一篇文章為目標（我能堅持這一點），理想情況是每週一次（我沒能堅持這一點）。這是一個與「定期發表科學論文」相當的產出目標——它並非直接導致世界變得更好。完全有可能連續幾年每週寫一篇文章卻絕對沒人閱讀，且這對世界沒有任何影響。

但對我來說，表現得好像產出直接導致價值成果是有用的。在我的一生中，我寫了不少部落格文章，通常只是為了寫而寫。後來，不同的人為此感謝我，說這些文章對他們很有價值。顯然，如果我追求我覺得有趣的事，這些事通常對其他人也有趣。

雖然我不期望我寫的每篇部落格文章都既有趣又有價值——我預期其中很大一部分最終會被證明價值不大——但每一篇都有機率被證明是有用的。還有一種效應是，我收到的回饋會影響我未來寫作的內容——如果人們對某些主題反應特別好，我就更有可能寫那個主題。

話雖如此，雖然在某種程度上表現得好像產出與價值成果之間有直接聯繫是有用的，但重要的是不要做得太過頭！如果我開始只優化發布頻率而不顧內容，產出與成果之間的聯繫就會消失——這又是古德哈特定律。

尤其是因為我一些較好的文章比其他文章需要更長的寫作時間——絕對超過一週。所以規則大約是——專注於頻繁寫作，不要太擔心任何單篇文章，除非在一篇文章上花更多時間能產出一篇明顯更好的文章，在這種情況下，確實要為了質量犧牲數量。

有趣的是，類似這樣的事情也遞迴地應用在「定期寫作」這個目標之內。具體來說，有一個問題是當我坐下來寫作時，我的目標應該是什麼。

我之前提到，如果我坐下來的目標是「寫完一篇文章」，那麼如果寫作時間比我想像的長，這種心態可能會適得其反。這類目標也很容易讓我陷入「把工作做完」的心態，我發現這對於創意工作通常是適得其反的。

所以即使我已經決定我瞄準的產出是「每月幾篇文章」，仍然有一個問題：我在某一天的產出目標應該是「完成一篇文章」還是「只是花點時間寫作」。

「只是花點時間寫作（或構思大綱，或思考文章主題等）」通常更好——除非快到月底了，我需要產出一些東西，即使我對它不完全滿意。而且「只是花點時間寫作」的目標仍有可能變質——如果我把所有時間都花在做一些與寫作略微相關的事，但在很長一段時間內都沒有取得任何實質進展。

同時，重要的是要對「某些日子確實會花在沒有任何實質進展上」感到釋懷，因為我的大腦需要時間進行背景處理，或者因為我走了一條最終證明是死胡同的路，或類似的情況。

David MacIver 寫道，他有時發現自己想讀更多書，但不確定具體想讀什麼，所以他需要讓自己閱讀直到弄清楚為止：

首先我編造一個數字，然後我給自己設定一個讓那個數字上升的目標。我創造了一個分數。

那個數字可以是任何東西，但兩個顯而易見的選擇是閱讀書籍的數量和閱讀花費的時間。讓這些數字上升需要我讀更多的書，所以我照做了。[...]

至關重要的是，透過將其變成一場遊戲，我將我的目標（讓數字上升）與我的目的——讀更多書——分開了。

當然，除了「讀更多書」並不完全正確。[...] 如果我只是想讀更多，我就會再去翻翻 Royal Road，讀讀像《時間的無限遞迴》之類的東西。我想要的並不完全是讀更多，而是讓我的生活因閱讀而豐富。而沒有任何數字能輕易捕捉到這一點。[...]

我過去曾多次使用「閱讀書籍數量」這個指標。它在讓我走出閱讀低谷方面效果非常好。我強烈推薦它作為一種方法。但在某個時刻，我總是開始注意到我故意選擇更短、更容易的書來讀，因為如果我選擇一本又長又難的書，那麼要讓數字按我想要的速度上升就會變得困難得多。通常這是一個信號，表明是時候停止追蹤這個數字了。

他描述方法的方式與我對寫部落格的想法相似：編造一個數字並將其視為價值成果。除了當我注意到這個數字分散了我對真正想達成目標的注意力時，我就應該停止將其視為價值成果。

我提到對於部落格文章，每篇文章都有機率具有價值，所以我可能只是專注於寫文章，並相信它們在預期中是有價值的，即使沒有哪篇特別突出。產出不等於價值成果，但我透過假裝它們相等而獲得了好的結果。

對於像對世界產生大規模影響這樣的事情，一個人可能會面臨這樣的困境：他們的整個職業生涯可能只有機率性的機會被證明是有價值的。也許某位研究人員追求某個特定的理論或發明，最終可能對人類極其有價值——或者它可能是一個完全的死胡同。也許一位改革者正致力於改變某個國家的現狀，而其他力量最終可能完全抹殺他們所有的工作。

在這種情況下，最好只專注於有機率導致好結果的產出。即使任何特定個人的努力很可能被浪費，但如果大量的人都遵循「做那些有微小機會產生巨大淨收益的事」的策略，這可能比他們都試圖極大化自己產生個人影響的機會更有影響力。許多社會改革也需要很長時間——幾十年或更久——將一個人的自我價值過多地與可見的結果掛鉤，在心理上可能是毀滅性的。

但與此同時，完全忽視所有工作旨在達成的目標仍然是不好的，否則它可能只會變成一個完全迷失的目的。

（還有一個巨大的話題是「如果你的工作可能產生負面影響怎麼辦」，這超出了本文的討論範圍。）

^(^)不過如果你是隧道人，光是挖了隧道本身可能就具有內在價值，無論它如何被使用。

討論

https://lesswrong.com/posts/Snt4zHHcLDQQ8jETt/inputs-outputs-and-valued-outcomes