Cohere 推出一系列開放式多語言模型

Cohere 推出一系列開放式多語言模型

Techcrunch·

企業 AI 公司 Cohere 推出了 Tiny Aya,一個支援超過 70 種語言的新系列開放權重多語言模型。這些模型可以在日常設備上運行,無需網路連接,並包含針對特定語言群體的區域變體。

圖片

圖片

主題

最新

AI

Amazon

Apps

Biotech & Health

Climate

Cloud Computing

Commerce

Crypto

Enterprise

EVs

Fintech

Fundraising

Gadgets

Gaming

Google

Government & Policy

Hardware

Instagram

Layoffs

Media & Entertainment

Meta

Microsoft

Privacy

Robotics

Security

Social

Space

Startups

TikTok

Transportation

Venture

更多來自 TechCrunch

Staff

Events

Startup Battlefield

StrictlyVC

Newsletters

Podcasts

Videos

Partner Content

TechCrunch Brand Studio

Crunchboard

Contact Us

圖片

Cohere 推出一系列開放多語言模型

企業 AI 公司 Cohere 在正在進行的印度 AI 峰會期間,推出了一系列新的多語言模型。這些模型被稱為 Tiny Aya,是開放權重的——意味著它們的底層程式碼是公開可用的,任何人都可以使用和修改——支援超過 70 種語言,並且可以在筆記型電腦等日常設備上運行,而無需網路連線。

該模型由該公司的研究部門 Cohere Labs 推出,支援南亞語言,如孟加拉語、印地語、旁遮普語、烏爾都語、古吉拉特語、泰米爾語、泰盧固語和馬拉地語。

基礎模型包含 33.5 億個參數——這是衡量其大小和複雜程度的指標。 Cohere 還推出了 TinyAya-Global,這是一個經過微調的版本,可以更好地遵循使用者指令,適用於需要廣泛語言支援的應用程式。區域變體完善了該系列:TinyAya-Earth 用於非洲語言;TinyAya-Fire 用於南亞語言;TinyAya-Water 用於亞太地區、西亞和歐洲。

圖片

「這種方法允許每個模型發展更強的語言基礎和文化細微差別,創建對其服務社群來說感覺更自然和可靠的系統。同時,所有 Tiny Aya 模型都保留了廣泛的多語言覆蓋範圍,使其成為進一步適應和研究的靈活起點。」該公司在一份聲明中表示。

Cohere 指出,這些模型使用相對適度的計算資源,在單個 64 個 H100 GPU(Nvidia 的一種高功率晶片)的集群上進行了訓練,非常適合研究人員和開發人員為說母語的受眾構建應用程式。這些模型能夠直接在設備上運行,因此開發人員可以使用它們來支援離線翻譯。該公司指出,它構建的底層軟體適合設備上使用,所需的計算能力比大多數同類模型要少。

圖片

在像印度這樣語言多樣化的國家,這種離線友好的能力可以開啟各種應用程式和用例,而無需持續的網路連線。

這些模型可在 HuggingFace(一個用於共享和測試 AI 模型的流行平台)和 Cohere Platform 上使用。開發人員可以在 HuggingFace、Kaggle 和 Ollama 上下載它們以進行本地部署。該公司還在 HuggingFace 上發布了訓練和評估資料集,並計劃發布一份技術報告,詳細說明其訓練方法。

這家新創公司的 CEO Aidan Gomez 去年表示,該公司計劃「很快」上市。 根據 CNBC 的報導,該公司在 2025 年底表現出色,年度經常性收入達到 2.4 億美元,全年季度環比增長 50%。

Techcrunch

相關文章

  1. Cohere 推出專為逐字稿設計的開源語音模型

    28 天前

  2. 印度 AI 實驗室 Sarvam 推出新模型,重金押注開源 AI 的可行性

    2 個月前

  3. Cohere 2.4 億美元年營收為 IPO 鋪路

    2 個月前

  4. Cohere Transcribe:頂尖語音辨識技術

    Hacker News · 23 天前

  5. 僅上線八個月,印度AI輔助編碼新創Emergent聲稱年經常性收入破億美元

    2 個月前