M

Mallam 1.1B 4096

由mesolitica開發
基於馬來語文本的1.1B參數預訓練模型,使用Mistral架構,支持4096上下文長度
下載量 201
發布時間 : 11/27/2023

模型概述

這是一個專門針對馬來語優化的1.1B參數大語言模型,在900億馬來語文本token上從頭預訓練,適用於馬來語文本生成和理解任務

模型特點

馬來語優化
專門針對馬來語文本進行訓練和優化
長上下文支持
支持4096 tokens的長上下文處理能力
高效訓練
使用Ray集群在5個節點(每個節點4×A100 80GB)上高效完成訓練

模型能力

馬來語文本生成
長文本理解
語言模型推理

使用案例

文本生成
馬來語內容創作
生成馬來語文章、故事或其他創意內容
對話系統
構建馬來語聊天機器人或虛擬助手
教育
語言學習輔助
幫助學習馬來語的用戶練習和理解語言
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase