L

Llama 3.1 Tulu 3.1 8B

由allenai開發
Tülu 3 是領先的指令跟隨模型家族,提供完全開源的數據、代碼和訓練方案作為現代技術的綜合指南。3.1版本在強化學習階段進行了改進,性能全面提升。
下載量 3,643
發布時間 : 2/7/2025

模型概述

基於Llama 3.1架構的8B參數指令跟隨模型,專為多樣化任務(如數學、GSM8K和IFEval)設計,具有優秀的性能表現。

模型特點

強化學習優化
3.1版本從PPO切換到GRPO(無獎勵模型),並調整超參數,性能全面提升
多樣化任務表現
在數學、GSM8K和IFEval等多樣化任務上實現優秀性能
完全開源
提供完全開源的數據、代碼和訓練方案

模型能力

文本生成
數學推理
代碼生成
指令跟隨

使用案例

教育
數學問題解答
解決GSM8K等數學問題
在GSM8K上達到90.0%準確率
編程
代碼生成
生成Python代碼
HumanEval pass@10達到84.8%
問答系統
知識問答
回答各類知識性問題
MMLU 5-shot達到69.5%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase