Llama 3 Gutenberg 8B
Llama-3-8bベースのファインチューニングモデルで、Gutenberg DPOデータセットを使用して最適化されており、テキスト生成タスクに適しています。
Downloads 18
Release Time : 5/5/2024
Model Overview
このモデルはLlama-3-8bアーキテクチャに基づくテキスト生成モデルで、DPO(Direct Preference Optimization)手法を用いてGutenbergデータセットでファインチューニングされており、命令追従能力とテキスト生成能力の向上を目的としています。
Model Features
DPOファインチューニング最適化
Direct Preference Optimization手法を使用してGutenbergデータセットでファインチューニングを行い、モデルの命令追従能力を向上させます。
LoRA効率的トレーニング
LoRA(Low-Rank Adaptation)技術を採用して効率的なファインチューニングを実現し、計算リソースの需要を削減します。
マルチタスク評価
複数のベンチマークテスト(IFEval、BBH、MATHなど)で評価を行い、多様なテキスト生成能力を展示しています。
Model Capabilities
テキスト生成
命令追従
マルチターン対話
Use Cases
教育
教育Q&Aシステム
教育分野のQ&Aシステム構築に使用され、学生の質問に答えます。
MMLU-PROテストで31.45%の精度を達成
コンテンツ作成
クリエイティブライティング支援
作家のクリエイティブライティングとコンテンツ生成を支援します。
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98