E

EXLMR

由Hailay開發
EXLMR是XLM-R的擴展版本,通過擴充分詞器詞彙表支持新語言並緩解未登錄詞問題,特別針對埃塞俄比亞低資源語言優化。
下載量 27
發布時間 : 8/21/2024

模型概述

EXLMR是基於XLM-RoBERTa的擴展模型,通過特殊方法初始化新增詞彙嵌入,提升對低資源語言(如阿姆哈拉語、提格雷語)的支持能力,同時增強原XLM-R的高資源語言性能。

模型特點

詞彙表擴展
詞彙表從250002擴展至280147,有效緩解低資源語言的未登錄詞問題
跨語言優化
針對埃塞俄比亞弱勢語言(如阿姆哈拉語、提格雷語)進行專項優化
嵌入初始化
採用特殊方法初始化新增詞彙的嵌入表示,確保模型有效利用新詞彙

模型能力

多語言文本分類
跨語言遷移學習
零樣本分類

使用案例

自然語言處理
多語言文本分類
對阿姆哈拉語、提格雷語等低資源語言文本進行分類
相比XLM-R提升未登錄詞處理能力
跨語言問答系統
構建支持埃塞俄比亞語言的問答系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase