S

Swallow 7b Instruct Hf

tokyotech-llmによって開発
Llama 2シリーズをベースに最適化した日本語強化型大規模言語モデル。教師あり微調整によりコマンド追従能力を向上
ダウンロード数 1,938
リリース時間 : 12/7/2023

モデル概要

燕モデルは東京工業大学LLMチームが開発した日本語最適化大規模言語モデルで、Llama 2をベースに継続的な事前学習とコマンド微調整により日本語処理能力を強化し、日英二言語タスクをサポートします。

モデル特徴

日本語最適化語彙
日本語専用トークンを拡張し、日本語テキストのエンコード効率を大幅に向上
二言語サポート
日本語と英語のタスク処理を同時にサポート
コマンド微調整
教師あり微調整(SFT)によりコマンド理解と実行能力を強化

モデル能力

日本語テキスト生成
英語テキスト生成
常識推論
オープンQA
読解
要約生成
数学的推論
機械翻訳

使用事例

教育
日本語学習アシスタント
学生が日本語の文法と語彙を理解するのを支援
JCommonsenseQA日本語常識テストで48.08%の精度を達成
コンテンツ作成
日本語記事生成
プロンプトに基づいて一貫性のある日本語記事を生成
XL-Sum要約タスクで18.30%のスコア
翻訳サービス
日英相互翻訳
日本語と英語間の相互翻訳を実現
WMT20英日翻訳でBLEUスコア25.10%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase