Llama-3.1-MIG-Tulu-3-8B-SFTオープンソースモデル - データセットに基づく微調整による多元的なアプリケーションの実現

Llama 3.1 MIG Tulu 3 8B SFT

xsampleによって開発

自動フィルタリングされた5万件のTulu-3-MIGデータセットでファインチューニングされたLlama-3.1-8Bモデル

ダウンロード数 26

リリース時間 : 4/17/2025

モデル概要

このモデルはLlama-3.1-8Bアーキテクチャを基に、Tulu-3-MIGデータセットでファインチューニングされた大規模言語モデルで、テキスト生成タスクに特化しています。

効率的なデータフィルタリング

MIG手法を使用して高品質なトレーニングデータを自動選別し、モデル性能を向上

性能最適化

複数のベンチマークテストで優れた成績、特にARC、BBH、GSMなどのタスクで顕著

オープンソースライセンス

Apache-2.0ライセンスを採用し、商業利用や研究利用が容易

テキスト生成

命令理解と実行

マルチターン対話

教育

インテリジェントチューター

学生の質問への回答や学習指導を提供

カスタマーサポート

自動カスタマーサポート

顧客の問い合わせやFAQ対応を処理

方法	データサイズ	ARC	BBH	GSM	HE	MMLU	IFEval	平均客観評価	AE	MT	ワイルド	平均サブ評価	平均
Pool	939K	69.15	63.88	83.40	63.41	65.77	67.10	68.79	8.94	6.86	-24.66	38.40	53.59
Random	50K	74.24	64.80	70.36	51.22	63.86	61.00	64.25	8.57	7.06	-22.15	39.36	51.81
ZIP	50K	77.63	63.00	52.54	35.98	65.00	61.00	59.19	6.71	6.64	-32.10	35.69	47.44
IFD	50K	75.93	63.56	61.03	49.39	64.39	53.60	61.32	12.30	7.03	-20.20	40.83	51.08
#InsTag	50K	72.54	64.80	69.83	48.17	63.50	65.99	64.14	6.58	6.84	-20.70	38.21	51.17
DEITA	50K	78.98	66.11	74.07	49.39	64.00	64.33	66.15	10.19	6.83	-19.95	39.50	52.83
CaR	50K	78.98	69.04	71.42	52.44	65.15	56.75	65.63	12.55	6.95	-20.67	40.57	53.10
QDIT	50K	79.66	65.42	70.74	53.05	65.06	57.30	65.21	15.78	6.76	-20.56	41.03	53.12
MIG	50K	80.00	66.39	72.02	57.93	64.44	65.06	67.64	14.66	7.32	-17.77	42.99	55.32