C

Cendol Llama2 7b Chat

由indonlp開發
仙都(Cendol)是一個開源的、針對印尼語進行微調的生成式大語言模型集合,涵蓋多種架構和參數規模。
下載量 1,749
發布時間 : 12/25/2023

模型概述

仙都(Cendol)是一個開源的、針對印尼語進行微調的生成式大語言模型集合,涵蓋了僅解碼器和編碼器-解碼器兩種Transformer模型架構,參數規模從3億到130億不等。本模型為70億參數的仙都(Cendol)LLaMA-2聊天模型。

模型特點

多架構與多參數規模
基於mT5和LLaMA-2兩種基礎模型,提供多種參數規模的模型,滿足不同場景需求。
指令調優版本豐富
包括針對特定任務的Cendol-Instruct和基於通用知識與以人為中心提示進行持續調優的Cendol-Chat。
性能卓越
在大多數測試基準上,大幅超越開源的多語言和特定地區大語言模型,小版本(參數少於10億)也能與70億參數的其他模型相媲美。
高效策略
提出詞彙替換策略,相比LoRA調優,在訓練和推理時間上分別提高了11.50%和18.71%,且評估性能與使用原始詞彙訓練的模型相當。

模型能力

印尼語文本生成
指令調優
單輪對話
自然語言理解
自然語言生成

使用案例

研究
印尼語自然語言處理研究
用於研究印尼語的自然語言處理任務,如文本生成、指令理解等。
在大多數測試基準上表現優異,超越其他開源模型。
通用知識問答
印尼語通用知識問答
用於回答關於印尼語通用知識的提問。
在人工評估中表現良好。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase