L

Llama 3.3 Swallow 70B V0.4

tokyotech-llmによって開発
Llama 3.3 Swallowは700億パラメータの大規模言語モデルで、Meta Llama 3.3をベースに構築され、英語能力を維持しながら日本語能力を強化しています。
ダウンロード数 1,950
リリース時間 : 2/17/2025

モデル概要

Llama 3.3 Swallowは、Meta Llama 3.3モデルに対して持続的事前学習を行い、大規模な日本語と英語のコーパスを用いてバイリンガル処理能力を強化して構築されました。

モデル特徴

バイリンガル能力強化
英語能力を維持した上で、日本語処理能力を大幅に向上させました。
持続的事前学習
大規模で多様なコーパスを用いて持続的事前学習を行い、モデルの性能を向上させます。
複数のモデルバリエーション
異なるバージョンと仕様のモデルを提供し、様々なニーズに対応します。

モデル能力

日本語テキスト生成
英語テキスト生成
機械翻訳
質問応答システム
コード生成
数学的推論

使用事例

教育
日本語学習支援
学生が日本語テキストを理解し生成するのを支援します。
日本語評価ベンチマークで優れた成績を収めています。
翻訳
日英相互翻訳
日本語と英語の機械翻訳タスクに使用します。
WMT20翻訳タスクで良好な結果を得ています。
プログラミング
コード生成
Google Pythonスタイルガイドに沿ったコードを生成します。
JHumanEval評価で優れた成績を収めています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase