L

Llama 3 Gutenberg 8B

Developed by nbeerbower
Llama-3-8bベースのファインチューニングモデルで、Gutenberg DPOデータセットを使用して最適化されており、テキスト生成タスクに適しています。
Downloads 18
Release Time : 5/5/2024

Model Overview

このモデルはLlama-3-8bアーキテクチャに基づくテキスト生成モデルで、DPO(Direct Preference Optimization)手法を用いてGutenbergデータセットでファインチューニングされており、命令追従能力とテキスト生成能力の向上を目的としています。

Model Features

DPOファインチューニング最適化
Direct Preference Optimization手法を使用してGutenbergデータセットでファインチューニングを行い、モデルの命令追従能力を向上させます。
LoRA効率的トレーニング
LoRA(Low-Rank Adaptation)技術を採用して効率的なファインチューニングを実現し、計算リソースの需要を削減します。
マルチタスク評価
複数のベンチマークテスト(IFEval、BBH、MATHなど)で評価を行い、多様なテキスト生成能力を展示しています。

Model Capabilities

テキスト生成
命令追従
マルチターン対話

Use Cases

教育
教育Q&Aシステム
教育分野のQ&Aシステム構築に使用され、学生の質問に答えます。
MMLU-PROテストで31.45%の精度を達成
コンテンツ作成
クリエイティブライティング支援
作家のクリエイティブライティングとコンテンツ生成を支援します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase