K

Komodo 7b Base

由Yellow-AI-NLP開發
科莫多-7B是基於Llama-2-7B通過增量預訓練和詞彙擴展開發的大語言模型,支持印尼語、英語及11種印尼地區語言。
下載量 1,113
發布時間 : 2/7/2024

模型概述

該模型專為處理印尼及地區語言設計,通過擴展詞表增強語言覆蓋能力,需進一步微調以適應下游任務。

模型特點

多語言支持
支持印尼語、英語及11種印尼地區語言,通過系統性詞彙擴展增強語言覆蓋
增量預訓練
基於Llama-2-7B進行增量預訓練,保留原模型優勢的同時適應印尼語言特點
高效詞表擴展
新增3000個高頻詞(2000印尼語+1000地區語言詞),顯著提升分詞效率

模型能力

印尼語文本生成
多語言混合處理
跨語言理解

使用案例

語言服務
印尼語內容創作
生成符合當地語言習慣的文本內容
輸出符合印尼文化背景的自然語言
地區語言翻譯
處理印尼地區語言與英語/印尼語之間的翻譯任務
在英印翻譯基準測試中達90.5分
文化研究
方言分析
識別和處理印尼不同地區的語言變體
方言檢測任務得分73.6
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase