預算編列技能可能具有最高的介數中心性

Lesswrong·

我透過數據科學與圖論探討人類技能的關聯性,並指出預算編列技能在不同專業領域之間扮演著關鍵的橋樑角色。

認識狀態: 抽象的主張,但基於數據科學……儘管這些數據科學有些過時。我寫於 2026 年 3 月 5 日,基於對 2017 年左右所做工作和應用方法的記憶。在看到這篇文章後,我意識到或許有人對此感興趣,於是將其發表。

假設我們為美國的每個人拍一張快照,並列出他們的「技能」清單,就像為《龍與地下城》(D&D)角色所做的那樣。

我想報告一下,如果這在現實生活中付諸實踐,我預期會發生什麼,以及為什麼(直到你讀到文章稍後部分,理解標題中關於「預算」技能為何重要的原因)。

我最近沒有使用現代數據做這件事,但我感覺這可能是我腦子裡大多數人不知道的東西,值得寫成一篇文章。

在文章的最後會有一個行動呼籲!我想在舊金山灣區成立至少一個「提升預算能力」的學習小組,這樣我就可以親自參加,面對面討論書籍、文章或工具。如果世界各地的各種聚會社群也能組建自己的在地學習小組,我會非常高興,這樣就能產生交叉授粉和短暫的多樣性等等

物件層級的技能討論

首先,無聊的技能

如果有一份美國每個人的技能清單,我們會看到很多人的主要技能是使用 QWERTY 鍵盤,並使用一套 Office 軟體來製作試算表、簡報和散文。

事實證明,你會看到很多人擁有 CPR(心肺復甦術)證照,而且現代獲得該證照的人幾乎也都會獲得 AED(自動體外心臟去顫器)證照。

(當我想到這一點時,它讓我想起《理性之道》裡的哈利在他第一天能買魔法裝備時,如何直接衝去買魔法急救箱。但同樣有趣的是,在現實中人們的對話裡,「技能」與「這些技能的證照」往往非常迅速地混為一談。)

在現實生活中,寫下每個人的技能清單可能會導致寫法上的差異。

有些人會寫「技能:word, cpr, aed, ...」,而其他人可能會寫「技能與證照:MSOffice, AED, CPR, ...」。在某種柏拉圖式的完美境界中,這些都會被解析並應用,以產生對清單作者相同基本能力、相同基本推論的理解

語言已經進行了歸併(lump)。要真正深入研究一項技能,你不僅要具備「可命名技能的名稱」,還要真正能「做」出事情來。

這裡可能還有子技能!

有些子技能甚至沒有名字,但仍然是可以傳遞和學習的東西,比如有人說「手要<這樣>握……看到了嗎?」然後說「不,你的小拇指擋住了……再多<這樣>一點」。我們對這一切都感興趣,當然,從微觀技能到宏觀層面皆然。

其次,技能清單

現實生活中大多數人都不能施放「治療法術」(因為據我所知,魔法並非真實存在)。

而「以色列近身格鬥術」(krav maga)非常罕見,也不是人們首先會想到的。

在現代世界的現實生活中,戰鬥並非核心……大部分情況下是這樣(儘管警察、士兵、保全和保釋代理人確實佔了工作職位中不小的比例)。

通常人們在網上列出技能清單時,想到的是「現實生活」中的平民就業市場。

即使在軍隊中,他們有複雜的軟體協助有效地殺人以達成外交目的(或其他目的),但在實踐中,他們最終需要建模並優化招募 18 歲年輕人的物流,並儘快將恰好數量的人轉化為「油罐車駕駛執照監考官」。從深層意義上講:很多技能其實相當平庸。

當然,「外面」的「現實」是模糊的

根據你歸併(lumping)或拆分(splitting)的程度,據我當年接觸數據時所知,大約有 5 萬到 20 萬種技能是人們認為足夠獨特、可以用不同短語寫出來的。

有些短語會指向擁有特定的安全審查級別,但通常有人可能只會寫「能力:office, cpr/aed, ... 安全審查, ...」,彷彿「安全審查」這四個字本身就是一項技能,或者指向某些技能,或者別的什麼?

轉喻是指當人們達到詞彙極限時,直接用附近已知的名稱來命名某物的現象。)

如果你認真去重(de-duping)人們使用的短語,並忽略孤詞(hapax legomena),或許可以將技能數量降到 3.5 萬左右。

但如果你只根據語義手動去重前 100 個最常見的技能,並用演算法去重技能清單中出現的短語(將複數和單數形式合併為一),同時保留那些「只有一個人認為值得列入清單」的短語,並且廣泛蒐集你能找到的所有英文履歷(從 1980 年代到 2026 年),我敢打賭你可以毫不費力地得到多達 30 萬種技能。

如果你把其中的每一項追溯到個人,並要求他們教別人這項「正式列出的技能」,我敢打賭,它通常會有 10 個子技能,而這些子技能只能用一個短語、句子或段落來描述……這意味著,可能存在約 300 萬種極其細微、需要「一段描述」才能指出的技能?比如「釘釘子時,另一隻手握住釘子的最佳方式」。

當我估計約有 300 萬種此類技能時,這只是非常粗略的推測……如果少於 50 萬種我會感到驚訝,如果多於 1000 萬種我也會感到驚訝。

第三,嚴肅的歸併開始

一個非常理性的人可能會認為這太瘋狂了。

他們可能認為「電腦」其實「只是一項技能」,而「git」和「svn」並非有意義的不同技能。

他們可能會斷言只有「一項」電腦技能,如果你非常擅長這項技能(但比一般人強!),你可以將其應用於技術支援工作,然後你可能會提升這項技能,直到你可以將其應用於電腦研究工作

這將是一個非常合理且務實的觀點,但在這種情況下,已經有很多先前的分類工作了!

勞工統計局(BLS)的理性人士已經將事物歸併為 832 個細分職業類別,這些類別又歸入 116 個中等粒度類別,以及僅僅 21 個基本類別

追隨他們,尋求「極度歸併」的類別,你可能會合理地說「技能」的總數……

……要麼是約 21 個(例如「法律」、「保護」、「生產」、「管理」、「銷售」等等)……

……要麼是約 116 個(例如「法律支援技能」、「消防技能」、「印刷技能」、「營運管理技能」或「批發銷售技能」)。

BLS 的分類……幾乎肯定太窄了。

那些並非真正的技能,對吧?

那些其實更像是職業類別……對吧?

但職業類別確實似乎在某種程度上暗示了某些技能可能比其他技能更具「趨同效用」(convergently useful),或者具有先決技能,且主要只有與其他技能協同作用時才有用。

大多數人都至少彈過一點鋼琴,比如在某個有鋼琴的地方等待時,為了消磨時間或因為無聊而彈奏;相當多的人練習過特定的鋼琴技能(而且有很多不同的技能需要分開練習,比如光是正確的坐姿就是一項),但如果我們屈服於極端歸併派及其傳統,即使使用全部 832 個 BLS 類別,所有(!)鋼琴技能(以及更多其他技能)都被歸併到了「27-2042 音樂家與歌手」中。

這「不足以」告訴我們每天應該花 10 分鐘練習什麼技能,或者如何僅憑網上抓取的數據,就聘請到能以我們真正想在酒吧聽到的方式彈奏鋼琴的人。

如果我們要根據對該工作中發生的認知或身體表現/能力的齒輪級理解來進行招聘,那麼我們需要比「職業」更細緻的東西來指向或推理,也就是那些「齒輪」。

第四,用數學來歸併技能?!

有一個想法:也許我們採用所有原始的技能清單,從某個語料庫中創建約 10 萬個有人提到過的技能(考慮到地區選擇、時代選擇和一定程度的去重)。

我們將每個獨特的技能視為網絡中的一個節點(或數學家所說的「圖論中的圖」)……然後對於每份履歷中的每個技能清單,我們在同一清單中出現的每對技能之間連線。

接著對下一份清單做同樣的事(如果它們在之前的清單中配對過,則將連線強度 +1,因此在處理了大約一打隨機履歷後,AED 和 CPR 很有可能擁有一個權重為 3 的連結)。

這給了我們一個加權圖,這出現在許多優化問題中,如最短路徑發現PageRank 等等。

我以前做過這個!這就是為什麼由來寫這篇文章 ;-)

許多技能「集群」會從這種分析中脫穎而出,形式是密集的派系(cliques),其中派系的許多成員與派系內的其他成員強烈連結,而與其他任何東西連結微弱。這些派系代表了同一份工作中要求的任務,或者是極其常見的通才教育中教授的能力,有時則是出現在「標準職業晉升」中的任務(例如製圖學生變成工程技術員,最終成為持照測量員,他們的技能清單包含了整個歷史中的事物)。

每隔一段時間,你會發現一些非常常見的技能,許多技能派系都指向它們。

例如,教育領域的教師們引以為傲的一系列技能中,到了職業中期,幾乎每個人都會在履歷上吹噓自己會「課程設計」(無論他們是數學老師、鋼琴老師還是幼兒園老師)。

還有其他技能,如「安全審查」,可能會出現在保護領域……

但接著,「CPR」與這兩者(以及許多其他領域)都有連結!

這強烈暗示在這些技能中存在高度的「趨同工具效用」(convergent instrumental utility),橫跨廣泛的領域,儘管該技能「狹義上是一項技能」,更像是可以教學、練習和測試的「git reflogging」,但「廣義上也是一項技能」,因為它幾乎對每個人都有用。

第五,尋找「介數中心性」,你會發現「預算」

圖論中有許多衡量「中心性」(centrality)的方法。

一種數學排列方式可能會擠出最大派系最中心的東西(而這個派系本身可能處於最大宏觀派系的中心,依此類推)……但那不會給我們這些可以教學和學習、且適用範圍極廣的技能。

如果我們在尋找幾乎任何領域或任何工作中都具有極其廣泛價值的技能,我們想要的是介數中心性(betweenness centrality)。

其運作方式(粗略地說)是我們挑選大量的節點對,並花費計算資源來尋找它們之間的最短路徑……一遍又一遍……每次我們這樣做時,我們都會為這條節點間「最短旅程」上的所有節點加一分。

最後,我們找到了瓶頸……主節點,那個你可以從中非常快速地到達「幾乎任何地方」的節點。

「課程設計」比「數學課程」更具中心性,因為它被更多種類、擁有更多樣化技能的人所調用。而「CPR」的介數中心性又比「課程設計」更高(因為 CPR 對擁有警察技能的警察、擁有游泳教練技能的救生員、消防員有用,但也對小學教師、夏令營導師等有用)。

重點來了:在所有技能中,介數中心性最高的是「預算」(budgeting)。

這……呃……你知道的……很有道理?也許吧? <3

第六,關於「預算」介數中心性的沉思

以下是一些想法:

第一,考慮「理性」的聖杯(在「可口頭傳遞的認知實踐,有助於在幾乎任何目標上獲得更高成功機會」的意義上,即技能遷移)。

尋找具有高技能遷移性和廣泛適用性的技能,可以讓你花最少的時間升級,並從中獲得最大的收益。

「預算」技能在這裡很有道理,因為……有限性無處不在?權衡無處不在?此外,時間是真實且普遍存在的。而「在稀缺情況下隨著時間推移進行權衡」基本上就是預算的本質。

「預算」可以說理應獲得某種光環,因為從第一原理出發,如果你真的以第一原理的方式思考「代理性」(agency)本身,幾乎每個代理人都會需要這項技能,這是說得通的。

第二,這在商業實踐中會出現,因為組織的「磨損」(mangle)通常導致少數幾個人出現在像……「預算委員會」(沒人想參加,因為聽起來太無聊了)中,掌握著巨大的組織權力,並且當預算導致每週、每月、每季、每年的組織選擇和行動調整時,他們需要能夠證明自己行使權力的正當性。

可以預見,這會出現在許多道德迷宮的核心。那麼,我們大概可以預期,就像「安全審查」技能一樣,「預算」是一個指向與語言使用相關技能的指標,用於以澄清以及政治性模糊的方式進行溝通,具體取決於預算制定者在跟誰說話。

這項技能可能在反歸納上難以掌握因為它交織在商業傳說(而非學術界)中,且預設就極具政治性。

第三,得出這類結論的技能清單通常來自各種各樣的人,他們在網上發布履歷等。其中一些人年齡較大,職業生涯更為資深。

很有可能,如果你在幾乎任何專業或組織中起步,並且擅長任何事情,最終你都會升遷到教學、指導、規劃,簡而言之就是「領導」的角色。而幾乎所有非微型組織的領導者都有會計和簿記工作要處理……而且還有這種想法:即「會計程序」可以用來映射、理解、控制並普遍引導一個團隊?

所以,也許預算的介數中心性來自於一個真實的瓶頸,這個瓶頸在許多職業生涯中反覆出現,在那裡「預算」(關於你的專業知識,代表集體行使該專業知識的群體)變得至關重要。

第四,我們可以將拜登的名言「別告訴我你的價值觀是什麼。給我看你的預算——我就能告訴你你的價值觀是什麼」與 LessWrong 上許多常見話題聯繫起來,例如金錢本身(關懷的單位!)凱利投注(本質上是迭代的投注預算),以及金錢與 VNM 理性效用函數和貝氏信念的關係

如果「預算」技能被證明是一項超能力,如果你感覺到更多可能性,其實並不會那麼令人驚訝。

關於方法論的部分

到目前為止,這篇文章都非常高層次。我還沒有真正證實它,除了隨口建議如果有人假設性地以強烈的操作性方式觀察描述世界的某些方式,可能會觀察到什麼。也許你只是覺得這沒道理?

我通常不喜歡談論我自己,但是……呃……

我在 2013 年申請去 Google 工作,當時我認為他們在奇點(Singularity)方面擁有「天命」。

(出於幾個原因。一個主要原因是,我之前認為奇點研究所更早擁有天命,但後來他們在 2012 年將旗幟、商標和社交推廣機構賣給了在 Google 工作的 Kurzweil。這是在 OpenAI 於 2014 年成立之前。如果我再多等一年,我也許就加入 OpenAI 了。)

到了 2018 年,我放棄了 Google,因為它是一個道德迷宮,顯然不會拯救世界。我轉而與朋友們一起開發一個區塊鏈項目,這與奇點或 AGI 沒有明顯的關係,但它給了我一個機會,以優渥的薪水設計去中心化的烏托邦和反烏托邦,這實在是太難拒絕了。

在 2013 年到 2017 年這段時間裡,我最初在 Google Brain 的「文化孤島」工作(因為有人告訴我可以從事旨在全面主動行善的深度學習),但在做了一年左右的廢事(比如試圖讓用戶觀看更長的 YouTube 內容,以便在中間插入廣告)後,我轉向了真正有意義的工作。

於是在 2015 年,我跳到了「PeopleOps」孤島。我不再是增加 YouTube 的「廣告庫存」,而是協助建立了[職位搜尋引擎](https://www.google.com/search?udm=8&q=ai jobs in Seattle),這是整個 Google 機器內部的眾多專題引擎之一,供該技術宏觀物件根據高層次指標來運用。

(職位搜尋似乎是我能找到的最接近善良之劍的東西,Google 機器很難對其進行過於嚴重的濫用。而且它似乎可以為那些使用「免費職位搜尋」(僅由廣告費支持)來尋找更好工作的人產生數萬美元的消費者剩餘。)

在 2015 年到 2017 年間的大約 18 個月裡,我一直在進行關於職位搜尋理論與實踐的數據科學研究,特別是透過「技能與教育」的視角。

我無法就此聯繫外部世界的人(因為我們不想洩露我們正在開發職位搜尋等產品),但我的團隊可以接觸到「所有的履歷」和「所有的職位發布」……至少是英文的(事實證明,美國不同就業市場使用的語言具有地域方言特色,所以我們一開始只針對少數幾個城市進行了優化,當我們嘗試使用機器翻譯將其推廣到泰盧固語或日語時,相關性數據完全崩潰了,因為人們在談論招聘和解僱時使用的委婉語中有很多細微差別)。

我們可以使用現在看來已經過時的、LLM 之前的 NLP 技術來解析和分析它們。因此,在一年多的時間裡,我確實可以進行上述那種分析,但是使用的是真實數據。

而「預算」確實從那些真實數據中脫穎而出,就在 2017 年左右,正如文中所述 <3

行動呼籲:學習小組

還有人想做這件事嗎?

我希望大家在評論區以各種方式發表意見,因為我仍然覺得「預算」是我「仍在」學習如何做好的事情。我很想聽聽好的教科書。我很想聽聽實戰故事。我很想聽聽如何每天花一小時練習、持續一週,就能變得非常擅長「預算」的方法。

有人知道如何聘請到一位在「預算」技能上簡直是奇才的最強 CFO 嗎?我不知道!我認為這是一項重要的能力,但我無法可靠地做到。

我願意每週開車去柏克萊一次,討論一些共同閱讀的內容,或者報告我們給自己佈置的作業,並聽聽其他人在「預算,這項最核心的技能」上的挑戰與成長 <3

參與討論

Lesswrong

相關文章

其他收藏 · 0