C

Cendol Llama2 7b Chat

由 indonlp 开发
仙都(Cendol)是一个开源的、针对印尼语进行微调的生成式大语言模型集合,涵盖多种架构和参数规模。
下载量 1,749
发布时间 : 12/25/2023

模型简介

仙都(Cendol)是一个开源的、针对印尼语进行微调的生成式大语言模型集合,涵盖了仅解码器和编码器-解码器两种Transformer模型架构,参数规模从3亿到130亿不等。本模型为70亿参数的仙都(Cendol)LLaMA-2聊天模型。

模型特点

多架构与多参数规模
基于mT5和LLaMA-2两种基础模型,提供多种参数规模的模型,满足不同场景需求。
指令调优版本丰富
包括针对特定任务的Cendol-Instruct和基于通用知识与以人为中心提示进行持续调优的Cendol-Chat。
性能卓越
在大多数测试基准上,大幅超越开源的多语言和特定地区大语言模型,小版本(参数少于10亿)也能与70亿参数的其他模型相媲美。
高效策略
提出词汇替换策略,相比LoRA调优,在训练和推理时间上分别提高了11.50%和18.71%,且评估性能与使用原始词汇训练的模型相当。

模型能力

印尼语文本生成
指令调优
单轮对话
自然语言理解
自然语言生成

使用案例

研究
印尼语自然语言处理研究
用于研究印尼语的自然语言处理任务,如文本生成、指令理解等。
在大多数测试基准上表现优异,超越其他开源模型。
通用知识问答
印尼语通用知识问答
用于回答关于印尼语通用知识的提问。
在人工评估中表现良好。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase