S

Serengeti

Developed by UBC-NLP
覆蓋517種非洲語言的大規模多語言預訓練模型
Downloads 25
Release Time : 1/7/2023

Model Overview

塞倫蓋蒂是一個專注於非洲語言的多語言預訓練模型系列,旨在解決非洲語言技術支持的不足問題。它支持517種非洲語言及其變體,在多項自然語言理解任務上表現優異。

Model Features

廣泛的非洲語言支持
覆蓋517種非洲語言及其變體,是目前支持非洲語言最多的模型之一
多任務優異表現
在8個自然語言理解任務的11個數據集上表現優異,平均F1分數達82.27
非洲中心主義設計
專門針對非洲語言需求開發,考慮非洲人民的使用場景和語言特點

Model Capabilities

掩碼語言預測
多語言文本理解
非洲語言處理

Use Cases

語言技術
非洲語言信息獲取
幫助非其他語言熟練者通過本土語言獲取重要信息
促進全球互聯
瀕危語言保護
為眾多瀕危非洲語言提供保存契機
激發這些語言在多領域的持續使用
學術研究
語言學研究
助力人類學家、語言學家等非洲語言研究者
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase