K

Kosolar 10.7B V0.2

由yanolja開發
基於upstage/SOLAR-10.7B-v1.0的韓語詞彙擴展版本,專門針對韓語網絡爬取數據集進行了微調。
下載量 21
發布時間 : 1/18/2024

模型概述

本模型通過預訓練新詞元的嵌入,並對已有詞元的`lm_head`嵌入進行部分微調,擴展了對韓語的理解能力,同時保留了基礎模型的原始參數。

模型特點

韓語詞彙擴展
通過精心挑選的8,960個韓語詞元擴展了詞彙表,提升了韓語理解能力。
選擇性參數凍結
凍結已有詞元的`embed_tokens`層,解凍`lm_head`層,平衡了韓語能力與原始語言性能。
多語料訓練
訓練數據包含韓語網絡內容(83.46%)、多語料庫(10.69%)和英語到韓語的段落對(5.86%)。

模型能力

韓語文本生成
多語言文本生成

使用案例

自然語言處理
韓語內容生成
生成符合韓語習慣的文本內容
多語言翻譯輔助
輔助英語到韓語的翻譯任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase