O

OPEN SOLAR KO 10.7B

由beomi開發
基於SOLAR-10.7B-v1.0的韓語增強版本,通過擴充詞彙表和韓語語料庫進行持續預訓練
下載量 1,151
發布時間 : 1/2/2024

模型概述

Open-Solar-Ko是一個專注於韓語處理的10.7B參數大語言模型,通過擴展詞彙表和增加韓語語料訓練提升韓語文本生成能力

模型特點

韓語優化詞彙表
擴展原版詞彙表至46592,顯著提升韓語分詞效率(示例文本分詞數從26降至8)
精選公開語料
僅使用AI Hub、Modu Corpus和韓語維基百科等公開韓語語料訓練,符合開源協議
高效架構
採用4k上下文長度和支持GQA(Grouped Query Attention)的優化架構

模型能力

韓語文本生成
英語文本生成
韓語理解任務

使用案例

自然語言處理
韓語文本生成
生成符合語境的韓語文本內容
情感分析
分析韓語文本情感傾向
在nsmc測試集上達到0.896準確率(50-shot)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase