newsencenewsence
探索
歡迎

你的個人知識庫

從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

了解更多

AfriMed-QA:為全球健康領域的大型語言模型進行基準測試

Google Research·7 個月前

Google Research 推出 AfriMed-QA,這是一個與非洲組織合作開發的資料集,旨在評估大型語言模型(LLMs)在非洲健康問題回答任務上的表現。此計畫旨在評估 LLMs 在關鍵的全球健康情境下的能力。

暫無內容

— Google Research

相關文章

  1. 個人健康代理的解剖學

    7 個月前

  2. 用於評估健康領域語言模型的規模化框架

    8 個月前

  3. Tx-LLM: Supporting therapeutic development with large language models

    超過 1 年前

  4. FACTS基準套件:系統性評估大型語言模型的真實性

    Google Deepmind · 4 個月前

  5. 透過利用所有層級來提升大型語言模型的準確性

    7 個月前

相關文章

  1. 個人健康代理的解剖學

    7 個月前

  2. 用於評估健康領域語言模型的規模化框架

    8 個月前

  3. Tx-LLM: Supporting therapeutic development with large language models

    超過 1 年前

  4. FACTS基準套件:系統性評估大型語言模型的真實性

    Google Deepmind · 4 個月前

  5. 透過利用所有層級來提升大型語言模型的準確性

    7 個月前