K

Komodo 7b Base

Yellow-AI-NLPによって開発
コモド-7BはLlama-2-7Bを基に増分事前学習と語彙拡張によって開発された大規模言語モデルで、インドネシア語、英語及び11種類のインドネシア地域言語をサポートします。
ダウンロード数 1,113
リリース時間 : 2/7/2024

モデル概要

このモデルはインドネシア及び地域言語の処理に特化して設計され、語彙拡張により言語カバレッジ能力を強化しています。下流タスクに適応させるためにはさらなるファインチューニングが必要です。

モデル特徴

多言語サポート
インドネシア語、英語及び11種類のインドネシア地域言語をサポートし、体系的な語彙拡張により言語カバレッジを強化
増分事前学習
Llama-2-7Bを基に増分事前学習を実施し、元モデルの優位性を保持しながらインドネシア言語の特徴に適応
効率的な語彙拡張
3000の高頻度語(インドネシア語2000語+地域言語1000語)を新規追加し、分語効率を大幅に向上

モデル能力

インドネシア語テキスト生成
多言語混合処理
言語横断的理解

使用事例

言語サービス
インドネシア語コンテンツ作成
現地の言語習慣に合致したテキストコンテンツを生成
インドネシア文化的背景に適合した自然言語を出力
地域言語翻訳
インドネシア地域言語と英語/インドネシア語間の翻訳タスクを処理
英印翻訳ベンチマークテストで90.5点を達成
文化研究
方言分析
インドネシア各地域の言語バリアントを識別・処理
方言検出タスクで73.6点を獲得
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase