S

Sea Lion 3b

由aisingapore開發
SEA-LION是一系列專為東南亞地區優化的多語言大語言模型,支持11種東南亞語言,基於MPT架構構建。
下載量 770
發布時間 : 10/24/2023

模型概述

SEA-LION-v1-3B是一個30億參數的大語言模型,專門針對東南亞語言進行預訓練和指令調優,支持英語、中文及9種東南亞本地語言。

模型特點

東南亞語言優化
專門針對11種東南亞語言進行訓練,包括低資源語言如老撾語和高棉語
大詞彙量支持
採用256K詞彙量的SEABPETokenizer,優化東南亞語言分詞效果
大規模訓練數據
使用9800億token的多語言數據進行訓練,覆蓋多種語言和技術領域
高效架構
基於MPT架構優化,32層解碼器結構,適合東南亞語言處理

模型能力

多語言文本生成
跨語言理解
代碼生成(Python/Javascript等)
技術文檔處理

使用案例

多語言應用
東南亞地區客服機器人
支持多種東南亞語言的自動客服系統
可處理11種語言的客戶諮詢
多語言內容生成
為東南亞市場生成本地化營銷內容
支持多種語言的廣告文案和社交媒體內容創作
技術應用
代碼輔助
支持Python、Javascript等語言的代碼生成與補全
可幫助開發者提高編碼效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase