觀點:引導 AI 走向我們渴望的工作未來

觀點:引導 AI 走向我們渴望的工作未來

Microsoft Research·大約 4 小時前

微軟首席科學家 Jaime Teevan 與研究員們深入解析 2025 年工作新未來報告,探討理想的 AI 驅動工作世界,並思索 AI 究竟是工具還是協作者,以及這個答案為何至關重要。

每項新興技術的背後,都有一個推動其前行的偉大構想。在微軟研究院(Microsoft Research)的播客系列《Ideas》中,微軟研究社群的成員們將探討激發其研究的信念、影響研究的經驗與思想家,以及其所追求的對人類的正面影響。

自 2020 年以來,作為「工作的新未來」(New Future of Work)研究計畫的一部分,微軟各地的研究人員針對人們的工作方式進行了關鍵研究、發掘與分析。他們透過多種視角進行探討——從疫情引發的變革、混合辦公模式的採納,到功能日益強大的 AI 模型問世——目標是賦予個人與組織即時重新定義工作的能力。

在本集節目中,微軟首席科學家兼技術院士 Jaime Teevan 與研究員 Jenna ButlerJake HofmanRebecca Janssen 暢談最新的研究成果:《微軟 2025 年工作的新未來報告》。團隊探討了報告中關於 AI 的採納與影響、創造人類蓬勃發展的未來所需的自覺性,以及目前對 AI 使用的觀感。此外,AI 究竟是「工具」還是「協作者」?為什麼這個答案至關重要。

閱讀部落格文章

了解更多:

訂閱 微軟研究院播客

逐字稿

[音樂]

JAIME TEEVAN: 事實上我們一直經歷的並非每年工作都在發生世代交替般的變化。更確切地說,我們正處於一場巨大的轉變之中,即數位技術如何支援人們完成任務。

JENNA BUTLER: 這並非預先設定好的。工作的未來正由我們、由消費者積極建構中。我非常喜歡這一點。

JAKE HOFMAN: 我們很容易會說,讓每個人都採用 AI 並提升效率吧。讓一切都變得非常快速,對吧。但我認為那並不是我們真正想要生活的未來。

REBECCA JANSSEN: 我們一直以過去為基準。例如 AI 能做什麼,或者 AI 能否做到我們已經在做的事情?我認為這是一個錯誤,或者說這只是第一步,更重要的一步還在後頭。

標準介紹: 您正在收聽的是《Ideas》,這是一個微軟研究院的播客節目,深入探討技術研究的世界以及程式碼背後的深刻問題。

[音樂漸弱]

JAIME TEEVAN: 嗨,我是 Jaime Teevan,微軟的首席科學家兼技術院士。今天我們要來談談工作的新未來。

回溯到 2020 年,來自微軟各地的研究人員聚集在一起,試圖理解因疫情而發生的工作實踐劇變。隔年,團隊發表了第一份《工作的新未來報告》。自那時起,微軟每年都會發布新報告,期間不乏各種干擾與重大的技術轉型。

今天加入我一起探討最新報告的是我的同事 Jenna Butler、Jake Hofman 和 Rebecca Janssen,他們是報告的眾多作者之一。

Jenna、Jake、Rebecca,歡迎來到本節目。

REBECCA JANSSEN: 謝謝 Jaime。

JAKE HOFMAN: 謝謝 Jaime。

JENNA BUTLER: 謝謝。

TEEVAN: 影響人們所做的工作以及工作方式的因素有很多,從社會因素、經濟因素到技術因素。正如我們從之前共同撰寫的報告中所學到的,要考慮到這種複雜性,需要許多不同的背景、知識庫、方法和研究方法論。

在深入探討報告細節之前,我想請各位分享一下你們為這份報告貢獻的經驗與專業知識,以及為什麼你們的工作至關重要。Jenna,請先開始。

BUTLER: 好的,謝謝 Jaime。

我從 2020 年計畫開始就參與了這份報告,我對我們所做的工作感到非常自豪。我認為它很重要有很多原因,但最重要的是,我認為特別是現在,人們覺得技術是「發生在他們身上」的,這些變化也是「發生在他們身上」的。事實上,我們引入社會的任何技術都是一種社會技術轉型(sociotechnical shift)。因此,人們如何看待它、使用它、想用它做什麼、願意為之付出什麼——這一切都很重要。因此,我認為這份報告賦予了人們一些主導權(agency),讓他們知道現在發生了什麼、最新的研究是什麼,以及他們自己的行為和觀點如何塑造了這項技術。

談到專業知識,我研究軟體工程的生產力,現在特別關注 AI 如何影響或改變它。但我最初的背景其實是研究癌症的生物資訊學。我一直很喜歡跨學科領域,因為我覺得在當今世界面臨的問題中,解決方案往往存在於多個學科的交界處。這份報告擁有來自世界各地超過 50 位作者,我認為這是一個非常有趣的例子,展示了當你把不同背景的人聚集在一起時,能產生多少精彩的成果。

TEEVAN: 謝謝 Jenna。Jake,你呢?

HOFMAN: 是的,我從 2023 年開始參與這份報告,時間比 Jenna 短,最初是作為 AI 與認知相關部分的作者,這是我們微軟研究院紐約實驗室的核心研究課題。最近,我與另一位研究員 Richard Banks 共同領導了一個全公司範圍的工作流,稱為「與 AI 共同思考與學習」(Thinking and Learning with AI),簡稱 TALA。

因此,Jenna、Rebecca 和團隊成員們(他們是報告的真正推動者和領導者)今年很客氣地邀請我擔任章節編輯。我欣然接受了,因為我知道這份報告的讀者群有多廣、影響力有多大。我認為這是一個絕佳的機會,可以從連貫的觀點和聲音中,展示不僅來自微軟、也來自各地的研究成果。

TEEVAN: 謝謝 Jake。Rebecca 呢?

JANSSEN: 是的,Jake,我們也非常高興你能加入擔任章節編輯。

是的,我在 2024 年 10 月全職加入微軟,所以算是我們三個人當中的新人。早在攻讀博士期間,我就對 AI 及其對工作和社會的影響感興趣,特別是從經濟學的角度。所以我一直對這個團隊的工作感到非常興奮,並且非常期待不僅在經濟學視角和相關章節出力,也能更廣泛地參與整份報告的編輯工作。

關於為什麼這項工作很重要,我認為這份報告最令人興奮的地方在於其多樣性——不同的人、不同的背景和不同的主題。有很多可以討論的內容,但也讓人意識到,AI 正在影響工作,同時也影響著生活的許多其他部分。

TEEVAN: Rebecca,我也很喜歡你的故事,關於你如何從微軟外部閱讀這份報告,然後有機會進來參與其中。我知道今年有很多參與者都這麼說。感覺它變成了一個像「機構」一樣的存在,這真的很酷。

JANSSEN: 是的,沒錯。

TEEVAN: 是的,非常酷。但對於那些「初次接觸」《工作的新未來報告》的聽眾,你們能分享一下它到底是什麼、是為誰準備的,以及人們可以用它來做什麼嗎?

BUTLER: 好的,我可以回答這個問題。顯然我有偏見——我認為它是為每個人準備的。但也許並非如此。但其核心理念是展示過去一年中所進行的研究。我們每年發布一次,通常在 12 月,針對正在發生的重大轉變進行探討,因此過去幾年 AI 一直是重要的一部分。我們的想法是不僅採用微軟的研究,也採用全球外部機構的研究,並嘗試將其總結為有研究支撐的簡短陳述。我們非常謹慎,確保只在我們有研究員、能提出大膽主張,且對數據及其支撐論點有信心的領域進行總結。

因此,如果你只想閱讀一份報告(雖然有點長),你就能相當廣泛地了解 AI 與工作領域正在發生的事情。從經濟到採納情況,到思考與學習,再到特定行業,以及公司外部頂尖專家的想法與預測。它應該能讓任何學術受眾廣泛理解,你不需要成為 AI 專家也能閱讀。希望它能在各個領域提供幫助。

TEEVAN: Jenna,回顧過去五年——這是我們的第五份報告——有一件事讓我印象深刻。每次我們準備發布報告時,感覺就像是:「天哪,工作已經改變了,再也回不去了。」[笑聲] 我其實讀了過去報告的引言。

2021 年,在思考疫情時,我說:「工作將永遠不再相同!」 2022 年,當我們轉向混合辦公時,我說:「工作的變化速度比這一代人經歷過的都要快。」 2023 年——「我們經歷的不僅是一個,而是兩個世代交替的工作方式轉變。」 然後最近,顯然我們一直在談論 AI 對生產力的轉型影響

製作這份報告的一個樂趣在於,觀察這些隨時間推移、感覺截然不同的轉變,並能看見其中的脈絡與聯繫。因為事實上我們所經歷的,並非每年工作都在發生世代交替般的變化,而更像是我們正處於一場巨大的轉變之中,即數位技術如何支援人們完成任務。

我很想知道,在過去五年中,你們在業界、學界,甚至個人層面上,見證了哪些關於 AI 與工作的態度與理解的變化?

HOFMAN: 也許我可以先開始。我認為在過去三年中,研究界關於生成式 AI 與工作的變化是非常驚人的。

我記得 2023 年 1 月,大家都在全力衝刺。每個人都在盡其所能地單獨評估模型,因為那是人們當時能接觸到的東西。但在「人機協作」(humans in the loop)以及評估當模型不僅僅是在參加標準化測試或基準測試時會發生什麼方面,研究還非常少。這正是我們立即關注的重點,因為這觸及了我們實驗室的專業領域。雖然當時也有其他研究,但在誰能接觸到模型、誰有能力設計並運行涉及「真人」的實驗方面,仍然相當有限。即便如此,當時大多也僅限於實驗室環境。

現在,快進到三年後,幾乎每個人都能接觸到他們想要的任何模型。他們擁有驚人的工具來建構和設計實驗,並且可以在實地環境中運行。我認為研究重點也發生了轉移,從「這項工具能讓我們加快多少速度」轉向「更廣泛的影響是什麼」——這對思考與學習特別令人興奮——這些工具在效率之外所產生的影響。

這真的很神奇。在其他任何時代,你都沒見過這種從少數人進行小型實驗室研究,到大量人員進行具有深遠影響的實地實驗的三年跨越。

TEEVAN: 是的。Rebecca 或 Jenna,你們在自己的工作實踐中是否也觀察到了 Jake 所說的研究變化?

JANSSEN: 是的,絕對有。我想說,看到這些工具如何幫助你是非常有趣的。我的意思是,當我開始或完成博士學位時,正值 AI 浪潮真正興起,即使在這麼短的時間內,我也觀察到:「喔,它在哪裡能幫到我?在哪裡它對我的幫助沒那麼大?」還有隨之而來的壓力:「喔,我想在哪些環節保持親自參與?」我認為這對我來說至少仍是一個持續進行的過程,去摸索出答案。我想這也是我從其他人那裡聽到的,他們正在進行大量的實驗與嘗試,找出它究竟在哪些方面從更廣泛的層面改變了事物與工作流程。

BUTLER: 是的,Rebecca,關於它在哪裡有幫助或沒幫助的那一點,過去五年報告中讓我印象深刻的是其中的細微差別,以及我們預期的某些事情與實際情況並不一定相符。

就像當我們全部轉為遠距辦公時,我們以為人們會感到孤獨。雖然有研究探討這一點,但結果卻是:等等,有些人反而發展得很好。那是怎麼回事?然後是混合辦公,我們發現並非所有人都需要回去辦公室,或者我們只需要「有時」回去。

接著是 AI:「這項不可思議的工具——每個人都會受益。」然後我們發現,喔,誰能受益以及如何受益取決於非常多因素,甚至包括他們是否相信這項工具有用、他們正在執行什麼樣的任務,以及他們的解決問題風格。因此,看到每個工作者的獨特性、每個人的差異,以及沒有單一標準答案,這過程非常有趣——雖然棘手,但這讓我們有工作可做。

TEEVAN: 是的。我喜歡這種思考人們不同方式的觀點。聽完你們三位的分享,看到你們對工作實踐變化的多樣看法,顯然「採納」(adoption)非常重要,我知道這也是我們報告的核心。

Jake,你提到每個人都能接觸到模型。但並非每個人都在使用模型,而且我們使用模型的方式肯定也不盡相同。

我想請你分享一下,報告中關於目前的採納程度、誰在使用以及如何使用,有哪些發現?

JANSSEN: 根據研究——這主要基於在不同國家進行的調查,當然還有一些實地實驗研究——我們看到 AI 的採納程度整體確實在增加,但在「誰在使用」以及「用於什麼目的」方面,存在著非常顯著的差異與細微差別。

例如,一項德國調查發現,大約 38% 的受訪者在工作中使用 AI。但這只是平均值。我們確實看到不同行業之間存在巨大差異。

其他調查結果顯示,IT 和採購部門是比較願意使用 AI 的行業或部門,而行銷或營運部門則相對較少

還有證據顯示男性比女性更願意使用 AI。我不知道現在這個差距如何,我希望它能進一步縮小。但這大概是 AI 採納程度的高層次概況。

至於人們將其用於什麼目的,現在有更多研究透過聊天對話來觀察使用者的意圖與目標。微軟內部也有一個團隊做了類似的研究,他們發現資訊檢索與溝通是排名前列的使用意圖。肯定有很多與寫作相關的任務是透過聊天工具完成的,我認為這是我們看到的大趨勢。

但即便如此,我認為這也很大程度上取決於人們使用的是哪種 AI 工具。例如,Anthropic 的研究有時顯示在程式編碼和開發者案例上的權重更高。所以確實存在多樣性。

TEEVAN: Jake,我知道你也對教育背景下的情況做了很多研究。你能分享一下嗎?

HOFMAN: 是的,我認為報告在這方面給出了非常明確的數字。最近的調查顯示,80% 的 K-12(幼兒園到高中)教師和 90% 的學生報告曾使用生成式 AI 處理學校作業,且使用量逐年增長。

有趣的是,雖然有無數的教育工具、特定版本的生成式 AI 產品和各種新創公司,但幾乎所有的報告都顯示,人們使用的是通用的現成產品,如 Copilot、ChatGPT、Claude、Gemini 等,而且不一定是在「學習模式」下使用。我認為這反映了目前在政策與培訓方面的巨大缺口——每個人都在使用這些工具,但對於如何建設性地使用它們,缺乏完善的指導。

好消息是,我們今年看到了巨大的努力。例如美國教師聯盟(American Federation of Teachers)與微軟、OpenAI 和 Anthropic 合作,啟動了一個大型計畫,旨在重新培訓教師,並提供適當使用這項技術的培訓。所以我認為這充滿希望,但我們也確實應該密切關注,確保我們以正確的方式使用這些工具。

TEEVAN: 是的,挑戰之一在於工具變化太快。當明天情況就不同時,很難提供任何指導。

HOFMAN: 確實如此。

TEEVAN: 是的,我也深有同感。

人們總是問我:「關於人們如何使用 AI,最讓你驚訝的是什麼?」有趣的是,幾乎就在某件事讓我驚訝之後的一週,每個人都會說:「那很顯而易見啊」,因為變化實在太快了。

但我還是要把這個問題拋給你們三位,我希望你們每個人都回答。我很想知道,關於目前個人和組織如何利用 AI,你們發現了哪些特別令人驚訝的事情?Jenna,請先開始。

BUTLER: 好的。我做了很多關於組織行為如何隨 AI 改變的研究,有些事情雖然在某種程度上是預料之中的,但我認為可能會讓其他人感到驚訝,那就是個人對這些技術採納的影響力有多大。

許多研究顯示,個人如何與同事討論 AI,會改變他們是否願意使用它或將其用於哪些任務,以及領導層如何展示和討論這些工具,會影響員工是否覺得自己可以使用它們

正如 Jaime 所說,雖然我們剛剛賦予了每個人使用這些不可思議工具的權限,但我們並沒有為他們提供確切的指南,因為工具一直在變。因此,許多最佳使用案例其實是由使用者自己摸索出來,並以「由下而上」的方式分享的。我覺得這是一項個人有很大機會協助塑造其使用方式以及如何在組織中傳播的技術。

HOFMAN: 是的。Jenna,如你所說,「由下而上」非常酷,而且人們進行實驗的程度以及對這些工具展現的創意,本身就讓我感到非常驚訝。

我認為這是一種會自我強化的過程。以前,將一個想法轉化為現實存在著很高的門檻——如果你在工作中有一些無聊、重複的事情想要自動化,你可能需要懂得寫程式,需要知道一堆晦澀難懂的事情才能實現,然後再分享給別人。現在,門檻降低了許多,所以你會看到各種創意想法和民主化的過程,人們可以非常快速輕鬆地與同事分享,然後突然間,每個人都在說:「你聽說某某人做了什麼嗎?我也要開始那樣做。」

另一方面,我認為實驗的速度之快有時也讓人有點擔心,有時人們甚至顯得有些不顧後果,特別是在 Agent(智能體)方面,人們會給予 Agent 所有權限,讓它們去做各種瘋狂的事情。有時這會帶來有趣的結果,有時則是不可欲的結果。所以,看到變化如此之快令人興奮,但我希望我們能找到一個平衡點,在快速行動的同時,希望不要「搞砸」事情。[笑聲]

JANSSEN: 是的,非常同意 Jake 關於實驗部分的看法。

對我來說,特別令人驚訝且著迷的是學習與這些工具互動的新方式。我們談論了很多關於多模態模型——可以生成文本、生成影片——還有與 AI 互動的方式。

在整份報告中,我也了解了一些使用者研究,探討我們雖然習慣使用文本工件,但也許我想強調某些內容,或者某些內容對我特別重要,所以我雙擊它,這樣工具就知道,喔,這是需要深入探討的部分。這些與工具互動的新方式非常令人鼓舞,因為它反映了個人是非常不同的,每個人都有自己的需求或偏好,而有些工具可以幫助滿足這些不同的偏好。

TEEVAN: 我們一直在討論採納情況,現在我想轉向討論 AI 對人們完成工作的方式產生的實際影響。顯然,影響程度受到採納情況的深度調節。

根據採納情況的發現或其他證據,關於 AI 帶來的變化,我們目前能得出什麼結論嗎?

BUTLER: 是的,我們觀察到了很多現象。雖然一方面仍有許多未知,但我們邊走邊觀察到了很多。

我們看到許多任務都能受到 AI 的影響。當我們思考這個問題時,我們不一定會考慮整個職位,例如職位如何作為一個整體發生位移,而更多是不同人所做的「任務」隨著時間在轉變。

具體到軟體工程領域,我們已經看到軟體工程師花更多時間以他們覺得有趣的方式與程式碼互動,例如處理更難的問題。他們有更多思考空間,能解決更多問題,減少做那些對他們來說枯燥乏味的樣板工作。但我們也看到這導致了一些職業倦怠或認知負荷過重,因為他們覺得自己「一直」在處理令人興奮的難題,大腦永遠得不到休息。

因此,這種每個職位執行任務方式的轉變是我們真正觀察到的,我們在白領工作者、涉及資訊的工作以及需要使用電腦的工作中看到了很多。他們有很多任務非常適合這項技術。

TEEVAN: 我很喜歡那種「擔心一直做困難、有趣、興奮的問題」的說法,因為我完全能感同身受。那是真實存在的,只是聽起來很有趣。[笑聲]

JANSSEN: 是的,關於採納與影響,我可以在報告的章節中補充一些關於勞動力市場的見解。

首先,我們現在對個人生產力影響有了更多洞察。已經有多項研究、實地實驗或實驗室實驗針對不同職業進行,比較使用 AI 與不使用 AI 的組別。我們通常看到的是,人們完成任務的速度往往更快,且通常能帶來更好的結果

話雖如此,也有研究顯示情況並非總是如此,或者提出了過度依賴的問題。人們需要確保自己仍然參與其中,並確認:這真的是 AI 能幫我處理好的任務嗎?還是我只是太依賴 AI 工具了?因此,在 AI 能做與不能做之間存在著一個「鋸齒狀邊界」(jagged frontier),以及人們如何與之互動。

在更廣泛的勞動力市場層面——這也是我們在報告中強調的——根據一些觀察就業率職位發布等數據的勞動力市場研究,我們目前尚未看到巨大的整體影響。如果你觀察特定的線上勞動力平台,情況可能會有所不同。但總體而言,我會說影響仍然是適度的。

有一個子群體我們現在有了早期洞察,可能受影響特別大的是「職涯早期工作者」,因為 AI 可能比他們職涯後期更容易完成他們的任務。但即便如此,我認為我們仍需要更多時間和證據來明確地說「這是因為 AI」,而非僅僅是宏觀經濟趨勢。

TEEVAN: 你認為我們什麼時候能開始看到那種影響?你認為是因為影響還沒發生在宏觀層面,還是僅僅是時間問題?

JANSSEN: 我認為兩者皆有。我還想說,AI 是一項技術,但我們生活在系統中,在組織中工作,組織會以某種方式採納它。我認為我們確實需要更多時間,也需要時間讓人們和組織真正思考:「我們希望這如何改變我們的工作環境?」

TEEVAN: 太棒了。事實上,我認為深入探討「我們想要什麼」是很有趣的。通常我們談論事情時都顯得非黑即白。我們如何能從中找到細微差別,並以此來塑造一個我們感到興奮的未來?

JANSSEN: 人們常說:「AI 正在產生這種影響或那種效果。」我認為這是所有作者和編輯一直強調的:「嗯,事情並非那麼非黑即白。」

例如,個人生產力影響不等於團隊生產力影響,因為獨自工作與在團隊中工作是完全不同的。此外,也不是「AI 用得越多越好」,或者使用 AI 越多就必然導致生產力提升。

正如 Jake 之前提到的,這很大程度上取決於人們如何使用 AI、以何種方式使用。他們是在自己思考任務之前使用,還是之後才用?我認為這是我腦海中浮現的兩點。

TEEVAN: 我們從歷史中確實看到,技術被採納的方式不一定是顯而易見的,正如 Rebecca 所說,當你將其引入系統時。Jake,我知道你在這方面也做了很多思考,例如社交媒體。

HOFMAN: 是的,在某種程度上,你可以把現在這個時刻看作是 AI 的「社交媒體時刻」。

社交媒體發展極快,採納也極快。它針對當時看似顯而易見的目標——採納率和參與度——進行了優化。但我認為,短視地優化單一目標會產生副作用。幾十年後的今天,我們很難釐清發生了什麼以及為什麼。

因此,當我們思考 AI、思考風險、思考事情是否非黑即白、是好是壞時,退一步說「這取決於我們用它設計出什麼樣的未來」是很重要的。關鍵在於不要短視地只關注容易達成的事情。我們很容易說,讓每個人都採用並提升效率,讓一切都變快。但我認為那並不是我們真正想要生活的未來——一切都只是快、快、快。因此,意識到我們掌握著主導權,並建立衡量與監控這些工具所產生的更廣泛影響的能力,這至關重要,這樣我們才能將事物引導至正確的方向。這是一個從過去學習並嘗試做些不同事情、引導未來走向良好方向的絕佳機會。

TEEVAN: 是的,在你的研究中,是否有具體的事情正在做,以嘗試走在前面或展望未來?

HOFMAN: 我認為最大的挑戰在於,在實驗室實驗或某些非常有針對性的實地實驗中,衡量對人的影響是相對可以做到的(雖然這始終是一個困難的社會科學問題)。但如果你退一步思考,作為一家大公司,我們如何在所創造的產品中大規模地做到這一點?我認為這是一個非常有趣且艱難的研究挑戰。

答案將是技術因素、社會因素、自動化遙測、調查等的結合。找出如何以一種對開發和發布產品的組織真正有效的方式來做到這一點,我認為非常重要且具有挑戰性。

TEEVAN: 我在想組織領導者甚至個人在這方面是否也應該做些什麼。

HOFMAN: 我再補充一點。領導者越能強調這是產品設計的一個重要面向,我們的情況就會越好。如果沒有領導者的這種表態,很難由下而上地發生,因為人們面臨著巨大的壓力,只想把東西做出來並發布。這是可以產生實質影響的一件事。

TEEVAN: 是的,這在某種程度上是在建立一種「複雜的 AI 素養」,而不僅僅是關注短期或短視。AI 素養作為一個主題貫穿了整份報告。

Jenna,我知道你也對此做了很多思考。我想請你談談 AI 素養如何與我們討論的主題相關,以及它在個人和組織層面如何產生影響,特別是在變化如此之快的情況下。

BUTLER: 是的。我非常認同 Jake 所說的,我們需要提出正確的問題,而不僅僅是看事情運作得多快,並理解人們實際如何使用它,因為人們對這些工具的看法會影響他們的使用方式。我們真的希望每個人在基礎層面上了解這些工具是什麼、擅長什麼、可能不擅長什麼、優缺點和風險是什麼。我們都在以各種方式看到這些情況發生。

我們在一項針對軟體工程師的研究中看到了所謂的「生產力壓力悖論」(productivity pressure paradox)。基本上,他們告訴我們:「嘿,我們拿到了這些工具;我們被告知會變得非常有生產力,但我們不知道它們是如何運作的,也不知道如何利用它們變得更有生產力,但老闆們正期待著產出更多東西。所以我乾脆加倍努力用我已經知道的方式工作。」因此,當工具引入時,雖然產出看起來增加了,但並非因為他們真正改變了工作方式以利用工具,而是因為他們不知道該怎麼做。

我們也知道人們對這些工具的感受——例如他們認為工具擅長什麼。我想每個人都看過那個問 ChatGPT「strawberry」這個單字裡有幾個「r」的迷因。對於我們這些知道它如何運作的人來說,這並不意外,它當然不擅長那個,對吧?但如果你不知道,你就不會提出正確的問題。

因此,我們真的希望人們對此有基本的了解,例如:如果我使用這個模型,有哪些固有的偏見是我需要注意的?它是否會因為想讓我感覺良好而引導我走向某條路,還是我應該多質疑它一點,問:「這真的是個好主意嗎?」我該如何使用它來讓我最有效率?

我認為我們需要給人們一點時間來學習。我們在組織中確實看到了這一點,部署速度很快,興奮度很高,但並非每個人都有時間真正學習並理解在他們自己的工作流、日常工作和工作方式中,這些工具如何影響他們並提高生產力。

JANSSEN: 接著 Jenna 剛才提到的關於人們對使用 AI 的感受:我認為這也是微軟內部及外部一個日益增長的研究領域。非常重要的是:使用 AI 對使用者、對不同年齡層的人有哪些心理影響?風險是什麼?我們需要關心什麼?我們在哪裡需要設置護欄?因為這些影響確實存在,我們需要像研究生產力影響一樣去研究它們。

報告中還有一個有趣的發現是關於使用 AI 時的社會觀感使用 AI 的人有時會被視為懶惰、價值較低。與此同時,每個人又被要求去使用它。此外,關於「我是否應該透明地揭露我使用了 AI」也存在信任問題。所以我認為這些研究領域的重要性與普遍性都在增加。

TEEVAN: 是的,到目前為止,很多研究都集中在個人如何使用工具,但 Rebecca 你剛才暗示的是,在社會背景和更大的系統中使用工具意味著什麼。關於 AI 在協作背景下的使用,有哪些早期研究成果?

BUTLER: 這是一個非常令人興奮的領域。第一份 AI 報告更多關注個人,然後我們開始觀察現實世界,而在現實世界中,我們是與他人合作的。因此,這些工具如何互動、協作以及調節協作絕對很有趣。

Rebecca 提到的一點是,感知方面存在很多問題。一項研究發現,如果給出相同的寫作材料,並說這是一位女性使用 AI 寫的,或者一位男性使用 AI 寫的,女性會被判定為能力較低,即使文本內容完全相同。因此,我們在現實世界中一直存在的某些偏見,正在轉化到這個 AI 的新世界中,進而影響我如何接收他人完成的工作。

一個正面的發現是,隨著 AI 變得越來越普遍,人們開始覺得「這就是個工具,很棒」,他們對他人使用 AI 的評判也會減少。但目前,有些人仍然對使用什麼、使用時發出什麼信號以及會被如何看待感到緊張。因此,即使在人與人之間的關係中,我們也看到它開始對人們的使用意願產生影響。

TEEVAN: 是的,很有趣。我們為 AI 使用的「隱喻」(metaphor)非常重要,我聽到我們在嘗試不同的隱喻。在某些方面,我們必須對 AI 有所不同的思考,因為以前我們與電腦的所有互動都是確定性的(deterministic),我們會告訴電腦我們想要它做什麼,如果它數不對「strawberry」裡的「r」,那就是它搞砸了。現在不同了,我們擁有這些隨機性(stochastic)模型,可以用自然語言與之交流。

在許多方面,它們更強大,但它們不是確定性的。所以有時我們會用人的隱喻,稱 AI 為「協作者」。有時,像 Jenna 剛才那樣,我們將 AI 視為一種「工具」,用來完成事情。

我很想知道你們在研究中會用到哪些不同的隱喻,以及你們認為這如何塑造了你們的研究演進、提出的問題,或者人們對此的思考方式。

HOFMAN: 是的,Jaime,這是一個很好的觀點。

就我個人而言,這更多是個人經驗,但它會滲透到研究設計和我們調查的事物中。我們在處理「隨機且不完全完美」的系統方面有豐富的經驗——那就是「人」,對吧?[笑聲]

在研究機構中,有一件事讓我感到很有趣,那就是我們非常習慣與實習生或學生合作,他們擁有豐富的專業知識,但並不總是能把每件事都做對。很多時候,思考如何與學生互動並審查他們的工作,對我來說與思考如何與 AI 工具互動並審查其產出非常相似。我看到這讓研究機構向使用 AI 工具的轉型變得非常順暢,而在其他背景下,例如藝術或創意環境中,這些工具可能被視為禁忌或不可欲的。

培養這種與系統互動的技能將變得越來越重要。我認為這是一個有用的隱喻:你會如何向一位技術精湛但並不完美的協作者描述這件事?

JANSSEN: 是的,我們目前正在撰寫去年的一項研究報告,我們給予兩組人不同的培訓:一組將 AI 框架化為「協作工具」,另一組則專注於工具的「技術能力」。我們確實看到,以更具協作性方式與工具互動或將其視為協作者的那一組,不僅有更好的體驗,也帶來了不同的結果。

因此,我確實認為我們體驗這些工具的方式以及我們以何種心態對待它們是有差異的。就我個人而言,我通常嘗試將其視為工具,但希望能與之互動、來回討論,而不是僅僅接受第一個輸出,而是真正地迭代。我認為研究也顯示這對使用者是有幫助的

關於個人與協作的問題,我還想補充一點:我們看到為協作或團隊設置建構工具,比為個人建構要困難得多,因為它帶來了許多新的層次。我們需要考慮社交智慧。團隊環境是什麼樣的?這在個人案例中是不存在的。我們什麼時候希望 AI 在團隊設置中介入?我們如何思考團隊的記憶?AI 需要意識到哪些潛在的情感設置或情感背景?

這要困難得多。我認為在這個過程中我們也學到了很多關於協作本身的知識。最近我在想,協作到底意味著什麼?是意味著我「與」某人一起工作,還是意味著我「為」某人工作?我認為找出這些細微差別真的非常有趣。

TEEVAN: 是的,我認為這是一個很好的觀點。在某些方面,協作的探索空間比個人生產力的探索空間大得多。我們已經看到,僅僅為了讓模型開始學習個人與模型互動的一些潛在基礎部分,就需要巨大的規模,當我們開始考慮更大的範圍時,這既是挑戰也是機遇。

Jenna,我想知道在軟體開發領域,特別是在協作背景下,你是否看到了有趣的隱喻或人們使用 AI 的方式?因為那是我們看到早期採納的地方,可以為未來的生產力任務提供很好的洞察。

BUTLER: 是的,我們在去年夏天做了一個有趣的研究,觀察那些擁有相同背景的人——他們在同一個團隊、處理相同的程式碼、有同一個經理——但其中一人用得很多,另一人則不然。我們訪談了他們以了解他們的感知。我們發現,使用較多的人更傾向於將其視為「協作者」而非「工具」。那些將其視為「工具」的人會假設它有一個特定的「用途」。你知道那句俗語嗎:「當你手裡只有錘子時,看什麼都像釘子」?所以如果這只是一個工具,我就必須找到釘子,那是唯一能使用它的地方。

但如果它是協作者,那麼當它運作不順時,他們會採取一種立場:也許是我的問題,我應該嘗試不同的提示語(prompt),我應該給它新的背景資訊。一定有某種方法能讓這東西在這種情況下運作,所以我不會放棄。

我們發現,以這種方式看待它的人,將其視為可以得出正確答案的協作者。我們甚至看到,有時你只需要鼓勵模型,告訴它們:「不,你可以做到的」,然後它就會給你答案。這真的很有趣。[笑聲]

TEEVAN: 永不放棄的小模型。

BUTLER: 是的!所以我們在開發者身上看到,那些堅持下去並像 Jake 所說的將其視為可以做不同事情的協作者的人,往往能從工具中獲益更多,他們對工具潛力的看法也更廣泛,並在更多背景下使用它,因此他們也更享受使用過程。

TEEVAN: 我喜歡這種想法,我們想要打破確定性的框架。因此,將 AI 視為協作者是有用的,這也符合我們「AI 協助激發人類最佳潛能」的理念。但我好奇這種略帶擬人化的隱喻是否在某些方面也限制了我們的想像力。AI 確實能做到人類做不到的事情。

例如,它可以大規模運作。突然之間,你可以輕鬆彙整成百上千人的自然語言。它的運作速度極快。你可以非常迅速地產生新想法和不同觀點。我一直在思考,下一個隱喻會是什麼,能幫助我們突破「與人合作」的思維限制?不知道各位對此有什麼看法。

JANSSEN: 還沒有!Jaime,我很想知道你有沒有答案。[笑聲]

TEEVAN: 我也還沒有答案。

BUTLER: 嗯,Jaime,我看了你關於 AI 為何不像人類的文章,以及考慮這些差異如何能更有效或幫助我們突破限制。我覺得那非常令人興奮,因為我認為我們看到很多公司和個人都在尋求將人類已經在做的事情自動化,並做得更快。就像 Jake 所說的,我們真的只想讓每件事都變快嗎?

那很容易,因為我們可以觀察人類在做什麼,我們可能已經在衡量人類的行為了……

TEEVAN: 我們也可以直接僱用更多人。

BUTLER: 是的,我們可以那樣做。但當我們開始思考它能做哪些人類做不到的事情時,我認為那正是我們需要想像力的地方,我們會開始思考:這與我以前做的任何事情都完全不同。

我非常熱愛太空,這讓我想到了很多關於太空探索的事情。並不是說在我們沒有電力和電腦時,我們只是去太空去得很慢,對吧?我們那時根本去不了太空。[笑聲] 你只是仰望星空,心想:「總有一天那會很酷。」然後當我們有了這項新技術,整個領域就開啟了。

所以我確實常在想,不僅有哪些事情是我可以做得更好、更快或並行處理的,還有哪些是我以前從未做過、但現在可以做到的?我認為那才是所有開放且令人興奮的部分所在。我只是還不知道答案。

TEEVAN: 喔,我喜歡你的隱喻,Jenna。我其實一直在看《銀河飛龍》(Star Trek: The Next Generation),談到《工作的新未來報告》的這些不同章節,這真的很神奇。當我在疫情期間看這部劇時,它非常完美,因為在某些方面,它就像是一個非常小的、封閉的社群在環遊世界,所以它既是在探索,又是一個小社群。現在顯然有了 AI、電腦和數據,我認為這提供了一個非常正面的未來願景。

在我們結束之前,我想我們可以花點時間思考我們所處的這個時刻——我們如何工作、我們如何看待他人工作、我們正在閱讀和進行的研究——並思考理想的「工作的新未來」是什麼樣子的。我們正在創造什麼,以及你想為此做出什麼貢獻?Jenna,請先開始。

BUTLER: 好的,這個問題真簡單。[笑聲]

TEEVAN: 是的,就請解決工作的未來吧。

BUTLER: 如果我們能做到就好了。

HOFMAN: 真是個簡單的問題。

BUTLER: 嗯,這件事最棒的地方在於我們可以提出這個問題,對吧?這並非預先設定好的。工作的未來正由我們、由消費者積極建構中。我非常喜歡這一點。所以我確實憧憬一個人類與 AI 共同蓬勃發展的未來,人類仍然可以從事有意義的工作。

在「工作的新未來」中,我們有一個關於「有意義的工作」的工作流。我們知道,當人們從事讓他們感到有連結感的工作時,社會運作得更好,人們也更快樂。因此,我不希望未來是用 Agent 取代工作。我真正希望的是 AI 能讓人類更蓬勃發展,讓人類仍然處於核心地位,並做一些改變世界的事情。如果 AI 醫生能與人類並肩作戰,或許能治癒癌症,我會非常興奮。那將是非常棒的。那是我最初的嘗試,我失敗了,但也許現在我們可以做到。

這就是我所希望的未來——既有經濟價值,又對世界的人類具有意義。這就是我希望透過我們的報告和研究描繪的未來。

TEEVAN: 謝謝。Jake?

HOFMAN: 是的,Jenna,我非常認同「人類蓬勃發展」這一點。我認為這在某種程度上是對微軟使命宣言——賦予每個人成就更多——最廣泛且最好的詮釋。我不認為這意味著寫更多文件、勾選更多任務。我不認為那是我們應該追求的版本。我認為這意味著做更多你熱愛的事情,少做你不熱愛的事情,這樣工作的未來就不會感覺像「真正的工作」。它不會感覺像是一種苦差事,你可以做那些讓你進入「心流」並享受其中的事情,時間飛逝是因為你熱愛所做的事。

我認為那是我們想要的未來。如果我們只是追求「更快」,它不會偶然發生。所以我真的希望我們所做的研究能為那個版本的未來做出貢獻,因為在那樣的未來裡,我們都會快樂得多。

JANSSEN: 是的,我認為你們兩位已經說得很美了,我完全贊同。

我也希望工作的新未來能讓工作中「人性化」的部分變得更顯眼、更受重視。在那個未來,人類能夠發揮創意或探索新的創意方式,帶入人類的判斷,引導方向,設定意圖。我認為那會非常棒。正如你們兩位所說,看到人類蓬勃發展並感到工作有意義,這真的很棒。

TEEVAN: 太好了。最後,我有幾個快問快答。問題很簡短,答案也可以很簡短,但其實都是挺難的問題。分享你們腦海中浮現的第一個想法即可。我會先問 Rebecca,然後 Jenna,最後 Jake。Jake,你最輕鬆,有幾秒鐘可以思考。[笑聲]

HOFMAN: 我就說「跟他們一樣」。[笑聲]

TEEVAN: 分享你們最真實的想法。

關於工作中的 AI,你最希望今天就能「破除」的一個誤解是什麼?

JANSSEN: AI 用得越多,你就越有生產力。

BUTLER: 我想我的跟 Rebecca 的很像,那就是如果你給某人這些工具,他們都會因為工具本身很好而變得有 10 倍的生產力。其實還有很多其他因素——他們如何看待它、他人如何看待它、它如何融入他們的工作流。僅僅給人們一個神奇的工具是不會改變生產力的。

HOFMAN: 我的想法是呼應 Rebecca 和 Jenna 剛才提到的:AI 並非全好也非全壞。我們如何設計和使用它非常重要。這取決於我們,我們可以引導它變得更好或更壞。

TEEVAN: 太好了。第二個問題:你希望報告中的哪一個發現能被大眾廣泛理解?

JANSSEN: 我認為我們一直以過去為基準。例如 AI 能做什麼,或者 AI 能否做到我們已經在做的事情?我認為這是一個錯誤,或者說這只是第一步,更重要的一步還在後頭。例如,AI 能做什麼或幫助我們做到哪些我們還做不到的事情?

BUTLER: 對我這個編輯來說,過去三年我都在報告中偷偷塞進同一張投影片,那是 Erik Brynjolfsson 的創新空間圖。其核心理念是:增強人類能力的機會遠大於取代或自動化人類的機會,在那個更大的空間裡,有更多的機會、更多的任務和更多的經濟契機。

HOFMAN: 我非常喜歡那一點,完全同意。我要指出投影片中我最喜歡的一張,是關於電腦科學教育的未來。人們可能認為 AI 的黎明意味著電腦科學教育的終結,或者人們不再需要了解電腦科學。我認為這張投影片做得很好,它談到了這其實只是對電腦科學定義的重新界定,將事物拉升到更高的抽象層次,思考運算思維、問題解決、清晰思考以及演算法式地拆解問題。我認為這是一個很棒的轉變,我很興奮能擁抱它。

TEEVAN: 太棒了。第三個也是最後一個問題,Jake,你已經回答了一半了。你最期待接下來研究的一件事是什麼?

HOFMAN: 是的,我可以把它與我個人一直在做的電腦科學角度聯繫起來。我認為賦予教師控制權並讓他們能看見學生在做什麼,是我們尚未廣泛做到並讓大眾接觸到的事情。這是我今年為自己的教學開發並測試的東西,也與許多學術合作夥伴進行了隨機對照試驗。我認為越早讓每位教師掌握這種能力,讓他們不再只是被動接受學生使用各種工具的結果,我們就越能糾正正在發生的事情。所以我非常期待接下來能繼續這方面的研究。

JANSSEN: 我想說,我們作為一個社群(無論是在公司還是學界),現在花了很多時間研究 AI 能自動化什麼。但我會很興奮並想更多地了解人們「希望」 AI 幫助他們做什麼,這又回到了那個問題:對於人類工作者和個人來說,理想的「工作的新未來」是什麼樣子的?了解這些影響並引導至這些方向。

BUTLER: 對我來說,在軟體世界中,我們看到既然人們可以做更多事情且不必做無聊的任務,他們的大腦就永遠得不到休息,人們感到有些倦怠。我非常好奇我們如何利用 AI 做更多事情,而不會把自己累垮,因為我們不是 AI,對吧?我們是人,我們有需求。所以我非常期待看到我們如何利用 AI 獨有的特性,以及人類獨有的特性,幫助人們像我們討論的那樣蓬勃發展。

TEEVAN: 謝謝 Jenna、Jake、Rebecca。感謝你們今天的參與。

[音樂]

也謝謝各位聽眾。如果您想了解更多關於報告以及 AI 如何改變人們工作方式的資訊,請造訪 aka.ms/nfw

今天就到這裡。下次見。

[音樂漸弱]

https://microsoft.com/en-us/research/podcast/ideas-steering-ai-toward-the-work-future-we-want/