E

EEVE Korean 2.8B V1.0

yanoljaによって開発
microsoft/phi-2を基にした韓国語語彙拡張バージョンで、韓国語ウェブスクレイピングデータセットに特化してファインチューニングされ、韓国語の理解能力が強化されています。
ダウンロード数 2,087
リリース時間 : 2/22/2024

モデル概要

このモデルは、新しいトークンの埋め込みを事前学習し、既存のトークンの`lm_head`埋め込みを部分的にファインチューニングすることで、基本モデルの韓国語理解能力を拡張しつつ、元のパラメータを保持しています。

モデル特徴

韓国語語彙拡張
新しいトークンの埋め込みを事前学習し、既存のトークンの`lm_head`埋め込みを部分的にファインチューニングすることで、モデルの韓国語理解能力を拡張しました。
多段階パラメータ凍結訓練
7段階のパラメータ凍結訓練プロセスを採用し、入力埋め込みから完全なパラメータへと段階的に訓練することで、モデルの語彙量を効果的に拡張しました。
効率的なクロスランゲージ転移
基本モデルの固有能力を活用し、知識と推論能力を韓国語に効率的に転移させ、適応プロセスを最適化しました。

モデル能力

韓国語テキスト生成
韓国語言語理解
因果的言語モデリング

使用事例

自然言語処理
韓国語テキスト生成
一貫性があり文脈に合った韓国語テキストを生成します。
韓国語言語理解
韓国語テキストを理解し処理するため、様々なNLPタスクに適用可能です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase