K

K2

LLM360によって開発
K2は650億パラメータ規模の大規模言語モデルで、完全に透明なトレーニング手法により、Llama 2 70Bを35%の計算量優位で凌駕しています。
ダウンロード数 109
リリース時間 : 4/17/2024

モデル概要

K2はMBZUAI、Petuum、LLM360が共同開発した大規模言語モデルで、2段階のトレーニングプロセスを採用し、英語テキスト生成タスクをサポートします。

モデル特徴

完全な透明性
コード、データ、モデルチェックポイント、中間結果を含むすべてのトレーニングリソースをオープンソース化
効率的なトレーニング
35%の計算量優位でLlama 2 70Bを上回る
2段階トレーニング
最適化された2段階トレーニングプロセスを採用
包括的な評価
汎用領域と専門領域をカバーする体系的な評価手法を提供

モデル能力

英語テキスト生成
医学知識QA
数学問題解決
プログラミングコード生成

使用事例

知識QA
一般知識QA
様々な常識的な質問に回答
IFEval評価で22.52標準スコアを獲得
専門領域
医学知識応用
医学関連の質問や文献を処理
医学評価で8.55標準スコアを獲得
法律テキスト処理
法律関連テキストの分析と生成
pile-of-lawデータセットでトレーニング
技術応用
プログラミング支援
コードの生成と補完
starcoderデータセットでトレーニング
数学問題解決
複雑な数学問題を解決
Math Lvl 5評価で2.04標準スコアを獲得
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase