L

Llama 3 Swallow 8B V0.1

tokyotech-llmによって開発
Meta Llama 3をベースに構築された日本語強化大規模言語モデル。継続的な事前学習と指示微調整により日本語処理能力を向上
ダウンロード数 2,230
リリース時間 : 5/20/2024

モデル概要

Llama3 SwallowはMeta Llama 3シリーズモデルを日本語データで強化学習したバリアントで、8Bと70Bの2つのパラメータ規模を持ち、英語と日本語のテキスト生成タスクをサポート

モデル特徴

日本語能力強化
大量の日本語データによる継続的事前学習で、日本語タスクのパフォーマンスを大幅に向上
バイリンガルサポート
英語と日本語の同時処理をサポートし、バイリンガルタスクで優れた性能を発揮
指示最適化バージョン
教師あり微調整(SFT)とチャットベクトル技術で最適化された指示バージョンを提供

モデル能力

日本語テキスト生成
英語テキスト生成
機械翻訳
質問応答システム
コード生成
数学的推論
要約生成

使用事例

自然言語処理
日本語質問応答システム
日本語ユーザー向けのインテリジェントQAアプリケーション構築
JCommonsenseQAベンチマークで89.45%の精度を達成
英日機械翻訳
高品質な英日双方向翻訳を実現
WMT20英日翻訳BLEUスコア0.2758
教育応用
日本語学習アシスタント
日本語学習者の言語練習と知識検索を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase