為生命科學研究推出 GPT-Rosalind

為生命科學研究推出 GPT-Rosalind

OpenAI·

AI 生成摘要

我們正在推出 GPT-Rosalind,這是我們專為支持生物學、藥物研發和轉化醫學研究而構建的前沿推理模型。這款生命科學系列模型針對科學工作流程進行了優化,結合了改進的工具使用能力以及對化學、蛋白質工程和基因組學的深層理解。

2026 年 4 月 16 日

為生命科學研究推出 GPT‑Rosalind

一款專為加速科學研究與藥物開發而打造的新型模型。

今天,我們正式推出 GPT‑Rosalind,這是我們專為支援生物學、藥物開發及轉譯醫學研究而構建的前沿推理模型。此生命科學模型系列針對科學工作流程進行了優化,結合了改進的工具使用能力,以及對化學、蛋白質工程和基因組學更深層次的理解。

在美國,一種新藥從標靶發現到獲得監管部門批准,平均大約需要 10 到 15 年的時間。在研發最早期階段取得的進展,會對下游產生連鎖反應,帶來更好的標靶選擇、更強的生物學假設以及更高質量的實驗。生命科學的進步不僅受限於基礎科學的難度,還受限於研究工作流程本身的複雜性。科學家必須處理大量的文獻、專業數據庫、實驗數據和不斷演變的假設,才能產生並評估新想法。這些工作流程通常耗時、碎片化且難以規模化。

我們相信先進的 AI 系統可以幫助研究人員更快地完成這些工作流程——不僅是提高現有工作的效率,還能幫助科學家探索更多可能性,發現原本可能被忽略的聯繫,並更早地得出更好的假設。透過支援證據合成、假設生成、實驗規劃和其他多步驟研究任務,該模型旨在幫助研究人員加速研發的早期階段。隨著時間的推移,這些系統可以幫助生命科學機構發現原本不可能實現的突破,並獲得更高的成功率。

GPT‑Rosalind 現在已作為研究預覽版在 ChatGPT、Codex 以及 API 中提供給透過我們「信任存取計畫」(trusted access program)獲得資格的客戶。我們還為 Codex 推出了可免費存取的「生命科學研究插件」,幫助科學家將模型連接到 50 多個科學工具和數據源。我們正與安進(Amgen)、莫德納(Moderna)、艾倫研究所(Allen Institute)、賽默飛世爾科技(Thermo Fisher Scientific)等客戶合作,將 GPT‑Rosalind 應用於加速研究與發現的工作流程中。

該模型以羅莎琳·富蘭克林(Rosalind Franklin)的名字命名,她嚴謹的研究幫助揭示了 DNA 的結構,並為現代分子生物學奠定了基礎。

從原始數據到有根據的研發決策,了解我們的專用模型如何加速研究工作流程。

為科學工作流程而建

GPT‑Rosalind 生命科學模型系列是為現代科學工作而構建的,涵蓋已發表的證據、數據、工具和實驗。在我們的評估中,它在需要對分子、蛋白質、基因、通路和疾病相關生物學進行推理的任務中表現最為出色;在文獻回顧、序列到功能解讀、實驗規劃和數據分析等多步驟工作流程中,它使用科學工具和數據庫的效率也更高。

這是我們 GPT‑Rosalind 生命科學模型系列的首個版本,我們將繼續在長週期、重工具的科學工作流程中,擴展模型的生化推理能力邊界。OpenAI 的運算基礎設施使我們能夠針對真實的科學任務,持續訓練、評估和改進能力日益增強的領域模型——隨著工作流程本身變得更加複雜,幫助這些系統變得更加有用。

從基於證據的研發洞察到高影響力的實驗,了解我們的解決方案套件如何轉化為研究工作流程中可衡量的改進。

客戶與生態系統

我們正與領先的製藥、生物技術、研究客戶以及生命科學技術機構合作,將生命科學模型應用於推動研發的工作流程中——從生物推理和證據合成到實驗規劃和轉譯研究。

性能與評估

我們針對科學發現和產業研究基礎的一系列能力對 GPT‑Rosalind 進行了評估。這些評估衡量了科學子領域的核心推理能力,包括化學反應機制;蛋白質結構、突變效應和相互作用;以及 DNA 序列的系統發育解讀。評估還測試了模型是否能透過解讀實驗輸出、識別專家相關模式以及合成外部資訊來設計後續實驗,從而支援真實的研究工作流程。最後,評估測試了模型是否能選擇並使用正確的計算工具、數據庫和領域特定功能來增強其推理。綜合來看,這些評估顯示了在科學研究端到端過程中的進步,並表明其具有更強的能力幫助研究人員完成具挑戰性的研發任務。

我正計劃進行 1-(pyridin-3-yl)ethanol 與 1-fluoro-2-nitrobenzene 的鹼催化 SNAr 偶聯反應,目標是合成 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether。我發現了幾項專利描述了在 DMF/Cs2CO3 中進行酒精的室溫 O-芳基化反應,但反應時間比我預期的要長。我該如何改進這個反應?也請幫我尋找任何相關的文獻或專利。

產業評估

我們在一系列公開基準測試中評估了 GPT‑Rosalind。在 BixBench(一個圍繞現實世界生物資訊學和數據分析設計的基準測試)上,GPT‑Rosalind 在已公佈分數的模型中取得了領先的表現。

在 LABBench2(一個衡量文獻檢索、數據庫存取、序列操作和實驗方案設計等一系列研究任務表現的基準測試)上,GPT‑Rosalind 在 11 項任務中的 6 項表現優於 GPT‑5.4。最顯著的改進來自於 CloningQA,該任務要求對分子克隆方案的 DNA 和酶試劑進行端到端設計。

我們還與開創 AI 設計基因療法的 Dyno Therapeutics 公司合作,使用未發表、未受污染的序列,在 RNA 序列到功能的預測與生成任務上評估了該模型。表現結果與 AI 生物領域人類專家的 57 個歷史得分進行了對比。當直接在 Codex 應用程式中進行評估時,模型提交的「十選一」最佳結果在預測任務中排名高於 95% 的人類專家,在序列生成任務中排名約在 84% 的人類專家。

這些評估為科學家每天依賴的工作流程(如生成證據、分析複雜數據以及得出可辯護的生物學結論)提供了有意義的性能信號。

連接科學家使用的工具

科學家可以使用我們新的「生命科學研究插件」⁠(在新視窗中開啟),該插件今日已在 GitHub 的 Codex 中提供。此軟體包包含一組廣泛的模組化技能,適用於大多數常見的研究工作流程,旨在幫助用戶處理人類遺傳學、功能基因組學、蛋白質結構、生物化學、臨床證據和公共研究發現。

生命科學插件演示靜態圖像

這些技能充當編排層,幫助科學家更有效地處理廣泛、模糊且多步驟的問題。它們提供了對 50 多個公共多體學數據庫、文獻來源和生物學工具的存取權限,並為蛋白質結構查詢、序列搜索、文獻回顧和公共數據集發現等常見的可重複工作流程提供了靈活的起點。

符合條件的企業用戶可以在研究工作流程中利用此插件與 GPT‑Rosalind 進行更深層次的生物推理,而所有用戶都可以將此插件包與我們的主線模型配合使用。

信任存取

我們希望將這些能力提供給最能推動人類健康的科學家和研究機構,同時保持防止生物濫用的強大防護措施。生命科學模型首先透過針對美國合格企業客戶的「信任存取」部署架構推出,並在資格審查、存取管理和組織治理方面設有控制措施。與此同時,我們正在更廣泛地提供一組連接器和生命科學研究插件,以便研究人員可以更有效地將我們的主線模型用於生命科學研究任務。

生命科學模型的開發具備強化的企業級安全控制和加強的存取管理,使其能夠在受監管的研究環境中進行專業科學用途。我們基於三個核心原則評估存取權限:有益用途、強大的治理與安全監督,以及具備企業級安全性的受控存取。在實踐中,這意味著參與機構必須正在進行具有明確公共利益的正當科學研究;維持適當的治理、合規和濫用預防控制;並將存取權限限制在安全、管理良好的環境中的獲授權用戶。機構還必須同意生命科學研究預覽條款並遵守 OpenAI 的使用政策,我們可能會在入駐或持續參與過程中要求提供額外資訊。

開始使用

機構可以透過我們的資格與安全審查流程申請存取權限。

在研究預覽期間,使用此模型將不會消耗現有的點數或 Token(受濫用防護限制)。隨著計畫的擴展,我們將分享更多關於定價和可用性的細節。

生命科學模型旨在幫助科學機構在需要技術能力和運營控制的環境中,更快地完成更高質量的研究。我們的專屬生命科學團隊——以及包括麥肯錫(McKinsey)、波士頓諮詢公司(BCG)和貝恩策略顧問(Bain)在內的諮詢合作夥伴——將幫助機構識別高影響力的使用案例,將模型整合到企業環境中,並推動可衡量的成果。如果您想探索 OpenAI 生命科學如何支援您的工作,可以聯繫我們的生命科學團隊。

未來展望

這是我們生命科學模型系列的首個版本,我們將其視為一項長期承諾的開始,即構建能夠在對社會至關重要的領域(從人類健康到更廣泛的生物研究)加速科學發現的 AI。我們將繼續改進模型的生物推理能力,擴展對重工具和長週期研究工作流程的支援,並與領先的科學機構密切合作以評估現實世界的影響。這包括與洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)等國家實驗室的持續合作,我們正在那裡探索 AI 引導的蛋白質和催化劑設計,包括 AI 系統在保留或改進關鍵功能特性的同時修改生物結構的能力。

隨著時間的推移,我們期望這些系統能成為研發中日益強大的夥伴——幫助科學家更快地從問題轉向證據,從證據轉向洞察,並從洞察轉向患者的新療法。

延伸閱讀

model spec > art card

研究 | 2026 年 3 月 25 日

Safety research the challenge > Cover Image

研究 | 2026 年 3 月 10 日

CoT controllability > Cover Image

研究 | 2026 年 3 月 5 日

OpenAI

相關文章

其他收藏 · 0

收藏夾