M

Mallam 1.1B 4096

Developed by mesolitica
基于马来语文本的1.1B参数预训练模型,使用Mistral架构,支持4096上下文长度
Downloads 201
Release Time : 11/27/2023

Model Overview

这是一个专门针对马来语优化的1.1B参数大语言模型,在900亿马来语文本token上从头预训练,适用于马来语文本生成和理解任务

Model Features

马来语优化
专门针对马来语文本进行训练和优化
长上下文支持
支持4096 tokens的长上下文处理能力
高效训练
使用Ray集群在5个节点(每个节点4×A100 80GB)上高效完成训练

Model Capabilities

马来语文本生成
长文本理解
语言模型推理

Use Cases

文本生成
马来语内容创作
生成马来语文章、故事或其他创意内容
对话系统
构建马来语聊天机器人或虚拟助手
教育
语言学习辅助
帮助学习马来语的用户练习和理解语言
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase