L

Latxa 7b V1.2

HiTZによって開発
LatxaはLLaMA-2アーキテクチャに基づくバスク語大規模言語モデルで、低リソース言語向けに設計されており、42億トークンのバスク語コーパスで訓練されています
ダウンロード数 875
リリース時間 : 6/11/2024

モデル概要

Latxaシリーズモデルは7Bから70Bのパラメータ規模を持ち、バスク語に最適化されており、言語理解と生成タスクで優れた性能を発揮し、英語とバスク語をサポートしています

モデル特徴

低リソース言語最適化
バスク語などの低リソース言語向けに特別に設計されており、高リソース言語と低リソース言語間の技術的ギャップを埋めます
高品質コーパス訓練
厳選された42億トークンのバスク語コーパスを使用して訓練されており、言語品質を保証します
複数規模選択可能
7B、13B、70Bの3つのパラメータ規模を提供し、様々な計算ニーズに対応します
オープンライセンス
LLaMA-2ライセンスに準拠しており、商業および研究用途が許可されています

モデル能力

バスク語テキスト生成
多肢選択式質問応答
読解
言語理解
英語テキスト生成(補助機能)

使用事例

教育
言語能力テスト
バスク語C1レベル試験問題の評価に使用
EusProficiencyデータセットで30.26%の精度(5サンプル)を達成
読解補助
学生がバスク語の文章内容を理解するのを支援
EusReadingデータセットで25%の精度(5サンプル)を達成
研究
低リソース言語研究
バスク語などの低リソース言語の大規模モデル研究のベンチマークを提供
モデル、コーパス、評価データセットを含む完全なツールチェーンを公開
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase