K

K2

由LLM360開發
K2是一個650億參數規模的大語言模型,通過完全透明化的訓練方案,以35%計算量優勢超越Llama 2 70B。
下載量 109
發布時間 : 4/17/2024

模型概述

K2是由MBZUAI、Petuum和LLM360聯合開發的大語言模型,採用兩階段訓練流程,支持英語文本生成任務。

模型特點

完全透明化
開源所有訓練資源,包括代碼、數據、模型檢查點和中間結果
高效訓練
以35%計算量優勢超越Llama 2 70B
兩階段訓練
採用優化的兩階段訓練流程
全面評估
提供涵蓋通用領域和垂直領域的系統評估方案

模型能力

英語文本生成
醫學知識問答
數學問題求解
編程代碼生成

使用案例

知識問答
通用知識問答
回答各類常識性問題
在IFEval評估中獲得22.52標準分
專業領域
醫學知識應用
處理醫學相關問題和文獻
在醫學評估中獲得8.55標準分
法律文本處理
分析和生成法律相關文本
使用pile-of-law數據集訓練
技術應用
編程輔助
生成和補全代碼
使用starcoder數據集訓練
數學問題求解
解決複雜數學問題
在Math Lvl 5評估中獲得2.04標準分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase