M

Meltemi 7B V1

ilspによって開発
初のギリシャ語大規模基盤言語モデル、Mistral-7Bアーキテクチャを基に、400億トークンのギリシャ語と英語コーパスでギリシャ語能力を強化
ダウンロード数 49
リリース時間 : 3/22/2024

モデル概要

アテネ研究革新センター傘下の言語音声処理研究所が訓練した初のギリシャ語大規模言語モデル、ギリシャ語と英語をサポート、テキスト生成能力を備える

モデル特徴

ギリシャ語最適化
Mistral-7Bトークナイザーを拡張しギリシャ語語彙をサポート、285億ギリシャ語トークンで能力強化
バイリンガル能力
ギリシャ語能力強化の一方で英語能力を維持、破滅的忘却を防止
長文コンテキスト対応
8192トークンのコンテキスト長をサポート
高品質コーパス
厳格なクリーニングと重複排除を施した400億トークンコーパスで訓練

モデル能力

ギリシャ語テキスト生成
英語テキスト生成
バイリンガルテキスト処理

使用事例

教育
ギリシャ語学習支援
学習者がギリシャ語コンテンツを理解・生成するのを支援
医療
医療QA
ギリシャ語医療試験データセットに基づくQA能力
医療MCQAギリシャ語テストセットで41.0%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase