L

Llama 3 Gutenberg 8B

nbeerbowerによって開発
Llama-3-8bベースのファインチューニングモデルで、Gutenberg DPOデータセットを使用して最適化されており、テキスト生成タスクに適しています。
ダウンロード数 18
リリース時間 : 5/5/2024

モデル概要

このモデルはLlama-3-8bアーキテクチャに基づくテキスト生成モデルで、DPO(Direct Preference Optimization)手法を用いてGutenbergデータセットでファインチューニングされており、命令追従能力とテキスト生成能力の向上を目的としています。

モデル特徴

DPOファインチューニング最適化
Direct Preference Optimization手法を使用してGutenbergデータセットでファインチューニングを行い、モデルの命令追従能力を向上させます。
LoRA効率的トレーニング
LoRA(Low-Rank Adaptation)技術を採用して効率的なファインチューニングを実現し、計算リソースの需要を削減します。
マルチタスク評価
複数のベンチマークテスト(IFEval、BBH、MATHなど)で評価を行い、多様なテキスト生成能力を展示しています。

モデル能力

テキスト生成
命令追従
マルチターン対話

使用事例

教育
教育Q&Aシステム
教育分野のQ&Aシステム構築に使用され、学生の質問に答えます。
MMLU-PROテストで31.45%の精度を達成
コンテンツ作成
クリエイティブライティング支援
作家のクリエイティブライティングとコンテンツ生成を支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase