L

Llama 3 Swallow 8B Instruct V0.1

tokyotech-llmによって開発
Meta Llama 3をベースに構築された日本語最適化大規模言語モデルで、継続的事前学習により日本語能力を強化し、教師付き微調整により指令追従能力を向上させました。
ダウンロード数 13.88k
リリース時間 : 6/26/2024

モデル概要

Llama3 SwallowはLlama 3シリーズをベースに継続的事前学習を行った日本語最適化モデルで、主に日本語データを追加し、SFT微調整を採用し、日本語と英語の多言語タスク処理をサポートします。

モデル特徴

日本語最適化
継続的事前学習により日本語処理能力を強化し、日本語のベンチマークテストで優れた成績を収めています。
多言語サポート
日本語と英語を同時にサポートし、言語間のタスクを処理できます。
指令微調整
教師付き微調整(SFT)とチャットベクトル技術を採用し、指令追従能力を向上させました。
高性能
日本語と英語の各種ベンチマークテストで優れた成績を収めています。

モデル能力

日本語テキスト生成
英語テキスト生成
機械翻訳
質問応答システム
コード生成
テキスト要約
数学的推論

使用事例

コンテンツ作成
日本語物語作成
日本語の文化背景に合った創作意欲溢れる物語を生成します。
例えば、例で生成された燕とラマの温かい物語のように。
教育
日本語学習支援
学習者が日本語のコンテンツを理解し、生成するのを支援します。
ビジネスアプリケーション
日本語カスタマーサービスロボット
日本語環境下でのスマートなカスタマーサービスシステムを構築します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase