過去一個月我使用 AI 的 10 個有趣案例

過去一個月我使用 AI 的 10 個有趣案例

Lesswrong·

我分享了過去一個月在日常工作中以創意方式使用 AI 的具體案例,包括自動轉錄並總結辦公室對話、自動修復團隊提到的程式錯誤,以及快速生成多種網頁設計方案。

我基本上在所有的工作中都會使用 AI 輔助,每天長達數小時。我的同事們也是如此。最近的調查顯示,超過 50% 的美國人在過去一週內曾使用 AI 來協助工作。我的建築師最近開始給我發送顯然是由 ChatGPT 生成的電子郵件。^([1])

儘管如此,我對其他人如何使用 AI 輔助知之甚少,這點令人驚訝。或者至少,我不知道那些不是在 Twitter 或 LinkedIn 上分享行銷課程的怪異 AI 網紅們是如何使用 AI 的。因此,這裡列出了 10 個我以至少帶點創意的方式使用 AI 的具體案例,以及效果如何。


1) 轉錄並總結我們團隊辦公室裡的每一次對話

利用一個名為「Omnilog」的 Lightcone 內部應用程式,我們在辦公室放置了一個麥克風,記錄所有的會議,透過 ElevenLabs 進行轉錄,並使用 Pyannote.ai 進行講者識別。這花了不少功夫且非常有價值,但對於本篇文章的大多數讀者來說,設置起來可能有點太麻煩了。

然而,我成功使用 Claude Code 執行的任務是:獲取該逐字稿(通常含有大量的轉錄和講者識別錯誤),對其進行清理、總結,並將摘要和完整逐字稿發布到一個頻道,讓團隊其他成員可以補上他們錯過的內容。

這是由 Claude Code 的定期任務功能驅動的。我每小時啟動一個 Claude 程序來查詢這些日誌,加上 Slack 討論串以及關於組織正在進行的事務的其他背景資訊。^([2])

這看起來運作得相當不錯!^([3])

我為每小時定期任務設定的提示詞(Prompt)

查詢遠端 Omnilog Neon 資料庫中過去 2 小時內團隊辦公室的逐字稿(包括講者身份),使用「Team Room」講者設定檔。然後將這些逐字稿清理成易於閱讀的散文。接著寫出逐字稿的摘要。
關鍵:僅使用 remote_browser_microphone 作為擷取來源。 desktop_microphone 會擷取到 Oliver 的私人通話、會議和其他非來自團隊辦公室的音訊。團隊辦公室的會議麥克風是透過 remote_browser_microphone 傳輸的。絕對不要發布來自 desktop_microphone 的逐字稿——那是私密的。

在請求逐字稿時,請為每個片段獲取至少前 3 個講者置信度,並思考 Pyannote 的講者分配是否錯誤。

搜尋 #listencone-livestream 頻道,查看你正在分析的逐字稿部分是否已經發布過。然後在頻道中發布,最上層是對話摘要,回覆中則是完整逐字稿。

發布到 Slack: 直接透過 curl 使用 Slack API 和 Lightcone Factotum 機器人權杖(token),而不是使用 Slack MCP 工具,這樣發文會顯示來自機器人而非 Oliver 的帳號。權杖位於 /Users/habryka/Lightcone/lightcone-factotum/.env.local 中的 SLACK_BOT_TOKEN。發布方式如下:

source /Users/habryka/Lightcone/lightcone-factotum/.env.local
curl -X POST https://slack.com/api/chat.postMessage \
  -H "Authorization: Bearer $SLACK_BOT_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"channel":"C0AFGB94E3W","text":"your message"}'

對於討論串回覆,請在 JSON 主體中加入 "thread_ts":"<parent_ts>"。你仍然可以使用 Slack MCP 工具來讀取/搜尋頻道。

如果根據逐字稿顯示沒有發生實質性對話,則不執行任何操作。

2) 嘗試自動修復團隊成員大聲提到或在 Slack 中抱怨過的任何簡單 Bug

同樣使用 Claude Code 的每小時任務,我會查詢...

  • 來自筆電麥克風的所有逐字稿,
  • 我們的團隊辦公室麥克風,
  • 我們 Slack 中的所有近期活動,
  • 以及我一直在處理的任何專案,
  • 和任何相關的 Github issue

...並要求 Claude 識別任何被提及或報告的 Bug。然後我要求它識別出一個看起來特別可能有簡單修復方案的 Bug,建立一個帶有建議修復方案的分支(branch),並在 Slack 中提供連結。

最初的幾次嘗試很糟糕。Claude 要麼過於雄心勃勃,試圖實現需要花費太長時間審核並增加技術債的功能;要麼修復我們已經修復過的 Bug;或者嘗試修復我們之前已經決定沒有簡單解決方案的 Bug。但在反覆調整提示詞並確保它真正掌握了所有相關背景資訊後,成功率顯著提高。

我們現在每天大約會合併一個以此方式產生的 Bug 修復。

我為每小時定期任務設定的提示詞

查詢我過去幾小時的 Omnilog 逐字稿數據,以識別我們是否在 Lightcone 團隊辦公室或我參加的任何會議中討論了任何重要的 Bug 或功能。

然後也搜尋 Slack 中關於此功能的任何近期對話以獲取相關背景。特別確保搜尋過去一個月的 #m_bugs_channel 和 #teamcone_automations,看看該功能或 Bug 是否在那裡被討論過,以及你是否能找到相關背景。在 #m_bugs_channel 中,如果一個 Bug 有打勾符號的反應,則表示已修復;如果有加號反應,則表示高優先級。同時確保沒有任何近期的 PR 已經處理了該 Bug 或功能。務必獲取你看到的任何討論 Bug 或功能的頂層訊息的完整討論串。

除了查看 forum_magnum_bugs,也要查看 forum_magnum_product。如果一個討論串提出了具體的變更(而非模糊的建議),請考慮實作它,並在討論串中回覆你的分支連結。

如果修復或變更影響特定頁面,除了連結預覽部署的首頁外,還要生成指向預覽部署內相關頁面的深層連結。例如,如果變更影響所有文章頁面,請連結至 <preview-deployment-base-url>/posts/bJ2haLkcGeLtTWaD5/welcome-to-lesswrong

在找到每個功能的相關背景後,決定其中是否有任何一個適合由你實作。不要嘗試修復你已經在 #teamcone_automations 中建立過討論串的 Bug 或實作該功能,除非對先前嘗試的回覆傳達了實質性的反饋。如果你決定不執行任何操作,則無需發布更新(我們不希望你發送每小時的垃圾訊息)。

如果是,請在適當的儲存庫(ForumMagnum, lightcone-factotum, omnilog 等)建立分支,並將該功能或 Bug 修復的實作提交(commit)到該分支。使用單個提交(或壓縮你的提交)。然後在 #teamcone_automations 中發布連結和簡短摘要,如果有相關的 Slack 討論串,也請在那裡作為回覆發布。連結分支的格式為 https://github.com/{org}/{repo}/{compare}/{base}...{branch}。確保提交訊息中包含 "preview" 一詞,這能確保我們建立預覽部署,使審核變更更容易。將分支名稱保持在 26 個字元以內,以免 Vercel 將其截斷並添加雜湊值。然後讓提交訊息和任何 Slack 訊息連結到 https://baserates-test-git-{branchname}-lesswrong.vercel.app

確保提交訊息連結到任何重要的 Slack 討論串(最重要的是 #m_bugs_channel 中的任何提及),並回覆任何明確討論此 Bug 的討論串,附上分支連結。在建立 PR 之前請先切換到 master!不要建立 PR,只需建立分支並從 Slack 連結它。

如果你在任何地方留下評論,請註明你是 CLAUDE 而不是我,即使你使用的是我的帳號。不要模仿我的口吻說話。

發布到 Slack: 直接透過 curl 使用 Slack API 和 Lightcone Factotum 機器人權杖,而不是使用 Slack MCP 工具,這樣發文會顯示來自機器人而非 Oliver 的帳號。權杖位於 /Users/habryka/Lightcone/lightcone-factotum/.env.local 中的 SLACK_BOT_TOKEN。發布方式如下:

source /Users/habryka/Lightcone/lightcone-factotum/.env.local
curl -X POST https://slack.com/api/chat.postMessage \
  -H "Authorization: Bearer $SLACK_BOT_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"channel":"CHANNEL_ID","text":"your message"}'

對於討論串回覆,請在 JSON 主體中加入 "thread_ts":"<parent_ts>"。你仍然可以使用 Slack MCP 工具來讀取/搜尋頻道。

3) 為 nowinners.ai 設計 20 多種不同的設計變體

Rob Bensinger 之前寫了一篇文章,彙整了與暫停或大幅放緩 AI 發展相關的論點和證據,以及政治上的支持。他認為將其放在獨立網站上以便於分享可能是個好主意,但我們真的不確定呈現文章資訊的最佳方式是什麼,以及網站應該具備什麼樣的氛圍。

所以我要求 Claude Code 幫我製作 20 多個變體,嘗試不同的設計和設計原則:

*大多數設計都很糟糕,但我喜歡其中 1-2 個的方向,然後我從那裡開始迭代,最終得到了目前的設計(現已在 nowinners.ai 上線)。

4) 審核我的 LessWrong 文章的正確性,並就其核心論點與我爭論

我不喜歡使用 LLM 來編輯我的寫作。^([4]) 然而,我不介意讓 LLM 幫我的文章進行事實查核,或者檢查其中是否有任何極其錯誤的地方,或是有任何明顯未處理的反駁論點。

這種做法的成功率相當低(大約只有 30% 的反對意見或批評是我最終想要處理的),但成本也很低,所以我通常在發布頂層文章之前都會這麼做。最近一次這讓我更新了關於演色性指數(CRI)與光光譜圖之間確切關係的模型。

LessWrong 編輯器提供了一個 API,讓 Claude 可以在任何草稿上發布和讀取行內評論,這讓整個體驗非常符合人體工學。

我請求反饋的提示詞

我正在 LessWrong 上寫一篇文章。

文章位於 https://www.lesswrong.com/editPost?postId=<ID>&key=<sharingKey>

請記得遵守我隨附的 LessWrong SKILL.md 中的指南和審核結構。

請閱讀這篇文章,並就其論點給我整體反饋,並對任何事實陳述進行事實查核。我希望你非常認真地思考這件事。如果需要的話,請進行「超思考」(Ultrathink)。我希望這篇文章很出色!

5) 在發布前刪除 LessWrong 文章中不必要的從句、句子、括號和隨機的贅言

我寫作最大的弱點就是太囉嗦。雖然你可能要從我冰冷死掉的手中才能搶走我的認識論限定詞(epistemic qualifiers),但我有時也會勉強承認,我寫的句子有一種迂迴的特質,往往長到讀者讀到結尾時,已經忘記開頭是怎麼寫的了。

這是我要求 Claude 幫我做的唯一編輯任務。

這並非完美無缺。特別是 Claude 喜歡用破折號結構來取代我長而迂迴的句子,雖然這並沒有真正引入任何新的詞彙或典型的 LLM 語氣,但仍然給我一種 LLM 的感覺。但大多數情況下,Claude 成功地識別了隨機的從句、適合開始新句子的位置以及不必要的重複結構,並成功地將其刪除。

我同樣使用 LessWrong 編輯器,這讓 Claude 可以直接在我的草稿上提出修改建議。

最近要求刪減內容的提示詞示例

<在一個以事實查核和整體論點反饋開始的對話中>

你能使用建議的行內編輯工具幫我刪減內容嗎?我通常太囉嗦了,過一遍來修正這一點似乎不錯。

6) 配對氛圍編程 (Pair vibe-coding)

Lightcone 團隊的每個人都使用 LLM 來驅動他們的程式開發工作。不幸的是,這導致整個組織的配對編程(pair programming)變得不再普遍。配對編程以前扮演著至關重要的角色:在定義模糊的產品任務上產生推動力、讓人們從基本原則出發思考產品,並提供一個社交環境,讓人更容易專注工作而不是被 Twitter 分心。

在 LLM 世界中,配對編程的問題在於,原本用於與編程夥伴交流的認知,現在都花在給 LLM 寫訊息上了。此外,在人們主要與 LLM 協作程式碼的世界裡,他們往往會在等待 LLM 回覆時同時處理多個任務。

但最近我們終於在配對氛圍編程(pair vibecoding)環節中取得了一些初步成功。基本設置如下:

  • Robert 和我討論了一個複雜的重構約 20 分鐘,然後讓 Claude Code 獲取該對話的逐字稿並產出實作計劃。在它運作時,我們繼續討論可能出現的問題。
  • 計劃準備好後,我們大聲進行審核,然後讓 Claude 獲取那段對話的逐字稿並相應地更新計劃。
  • 經過又一輪審核後,我們讓 Claude 實作變更。當程式碼進來時,我們一起查看,大聲指出問題,並讓 Claude 修復它們。

這效果真的出奇地好!那種某人消失幾分鐘去給 AI 建議的計劃提供反饋,或寫一篇長長的指令文章來提供所有必要背景的常見模式消失了。取而代之的是我們只需交談,而 Claude 在背景實作。

7) 使用 Claude Cowork 桌面控制大規模建立 100 多種 Suno 歌曲變體

當我製作一首新的 Fooming Shoggoths 歌曲時,我通常會針對一個寬泛的概念取樣數百次、有時甚至數千次歌曲生成,以獲得具有正確氛圍的作品。然後,在我有了看起來有前途或有趣的內容後,我會使用 Suno 的「Cover」和「Persona」功能進行迭代,直到我滿意為止。在我最近為了準備 4 月 1 日發布第二張專輯的衝刺中,我嘗試讓 Claude 在這裡主導更多的生成過程。

我把之前所有歌曲的歌詞和我想為新專輯探索的概念列表交給 Claude,並讓它控制我 Chrome 中的 Suno 分頁,提交風格和歌詞的大量交叉組合。

然後我聽了隨機取樣的前幾秒鐘,給了 Claude 一些高層次的反饋,並讓它生成更多變體。

這並沒有產生任何哪怕是稍微接近能放入專輯的作品,但它最終讓我認為 Indie-Rock、「The National」氛圍和一首關於 AI 時間線的歌曲之間有一個特別有前途的交集,這促成了 "Friday's Far Enough For Milk",這是我創作過第三喜歡的歌曲。

8) 要求 Claude 閱讀一本關於詞曲創作的書,然後批評我的歌詞

由於上一張 Fooming Shoggoth 專輯專注於試圖捕捉其他音樂中未涵蓋的特定氛圍的歌詞,我對詞曲創作思考了很多。在追求進步的過程中,Buck 向我推薦了他最喜歡的詞曲創作書籍:Song Building: "Mastering Lyric Writing (1) (SongTown Songwriting Series)"

當然,我不想等到讀完或略讀完一整本書後才從中獲益,所以我直接要求 Claude 幫我讀,並用它來批評我寫的歌詞。

Claude 總共花了 35 秒讀完這本 100 多頁的書,並將其應用到我的歌詞中。大多數反饋都很糟糕,因為 Claude 並不擅長詩歌或歌詞創作。但有些反饋相當不錯,讓 Claude 直接引用並將書中的原則應用到我的歌詞中,讓我比自己略讀並嘗試應用理解得更好、更快。

9) 找出那些我一直向人解釋到應該寫成部落格文章的事情

除了記錄團隊辦公室和筆電麥克風的對話外,Omnilog 每 15 秒還會擷取我的螢幕內容(除非它偵測到我正在看私密內容),這意味著它擁有一份非常完整的我的活動記錄。

所以我要求 ChatGPT 瀏覽過去 2 個月它擁有的關於我的所有*內容,並整理出我一直反覆解釋的主題,或許我應該寫篇部落格文章,遵循 Gwern 關於部落格文章的「三則律」

三則律:如果你(或其他人)已經解釋了同一件事 3 次,就該把它寫下來。

這顯然有趣到讓你不斷回頭討論,而且你現在已經有幾份草稿可以用了。

它總共產生了 40 個候選部落格文章^([5])。幾乎所有的都很糟糕。當它注意到我曾幾次大聲抱怨我們的 LessWrong 草稿頁面顯示了沒有標題且零字數的草稿時,它建議我寫一篇關於那個的文章!

標題:字數為零的無標題草稿不應存在

論點:產品介面不應向用戶顯示技術上真實但心理上毫無意義的物件。

容易寫的原因:一個小小的 UI 觀察就能寫出 500 字。

它推薦的 40 個文章標題中,有一個看起來很有前途:「寫得像 Claude 的 AI 正在讓我的警鐘失靈」。雖然標題(當然)非常糟糕,但我確實發現自己在過去幾週幾次指出,LLM 的寫作似乎被優化成一種不冒犯人的方式,這使得它在內部備忘錄或高風險溝通中變得很危險。

我的猜測是,Claude 的寫作被優化為在「缺乏模糊性可能會導致讀者注意到他們強烈反對內容」的地方精確地使用模糊性,這與我通常嘗試優化寫作的方式完全相反!

10) 為我的 LessWrong 文章建立微型互動式嵌入元件

最近兩篇 LessWrong 文章都包含了互動式小工具,在我看來,這些工具在解釋我試圖傳達的核心概念方面,比任何文字都做得更好:

這非常快速、直接,而且在我看來讓那些文章變得更好了。


就這樣。希望這 10 個具體例子對某些人有所幫助。也歡迎在評論中發布你自己的案例!我的感覺是,人們目前對 LLM 的創意用途分享得還不夠。

  • ^(^)是的,這有點令人擔憂,但我向你保證,Lighthaven 的結構安全沒有受到影響……大概吧。

  • ^(^)這確實意味著只有在我的筆電運行且開啟 Claude 應用程式時才會發生,這使得它並非極其可靠,但它已經足夠可靠到能獲得大部分價值。

  • ^(^)它並不完美(特別是 Omnilog 管道最近開始搞砸講者識別,所以逐字稿的品質有所下降),但它仍然足以讓你了解你錯過了什麼。

  • ^(^)我當然會廣泛地將它們用於研究,它們已經取代了我之前 50% 以上的 Google 搜尋,我認為這太過平凡,不值得出現在這篇文章中。

  • ^(^)它最初產生了 10 個,但我多次催促它繼續。

參與討論

Lesswrong

相關文章

其他收藏 · 0