L

Llama 3.1 Tulu 3.1 8B

allenaiによって開発
Tülu 3は最先端の指示追従モデルファミリーで、完全オープンソースのデータ、コード、トレーニング手法を提供し、現代技術の包括的なガイドとして機能します。バージョン3.1では強化学習フェーズが改善され、性能が全体的に向上しました。
ダウンロード数 3,643
リリース時間 : 2/7/2025

モデル概要

Llama 3.1アーキテクチャに基づく8Bパラメータの指示追従モデルで、数学、GSM8K、IFEvalなどの多様なタスク向けに設計されており、優れた性能を発揮します。

モデル特徴

強化学習最適化
バージョン3.1ではPPOからGRPO(報酬モデルなし)に切り替え、ハイパーパラメータを調整し、性能が全体的に向上しました
多様なタスク性能
数学、GSM8K、IFEvalなどの多様なタスクで優れた性能を実現
完全オープンソース
完全オープンソースのデータ、コード、トレーニング手法を提供

モデル能力

テキスト生成
数学推論
コード生成
指示追従

使用事例

教育
数学問題解答
GSM8Kなどの数学問題を解決
GSM8Kで90.0%の精度を達成
プログラミング
コード生成
Pythonコードを生成
HumanEval pass@10で84.8%を達成
質問応答システム
知識質問応答
様々な知識質問に回答
MMLU 5-shotで69.5%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase