X

Xlmindic Base Uniscript Soham

由ibraheemmoosa開發
這是一個基於ALBERT架構的多語言模型,專門針對印度-雅利安語系語言進行優化,支持ISO-15919轉寫文本處理。
下載量 117
發布時間 : 3/2/2022

模型概述

該模型經過微調,主要用於處理轉寫為ISO-15919格式的印度語言文本,支持多種自然語言處理任務。

模型特點

ISO-15919轉寫支持
模型接受ISO-15919轉寫文本,使不同書寫系統的印度語言能夠統一處理。
多語言能力
支持14種印度-雅利安語系語言的處理,具有跨語言表示學習能力。
高效架構
基於ALBERT架構,參數共享機制使得模型更輕量高效。
IndicGLUE基準表現優異
在多個印度語言處理任務上超越了mBERT、XLM-R等基準模型。

模型能力

文本分類
命名實體識別
掩碼語言建模
跨語言文本處理
印度語言理解

使用案例

新聞分類
孟加拉新聞分類
對孟加拉語新聞文章進行體裁分類
在Soham數據集上達到93.89%準確率
印地語新聞分類
對BBC印地語新聞文章進行分類
達到79.14%準確率
語言理解
跨語言文本處理
處理轉寫為ISO-15919格式的多種印度語言文本
在IndicGLUE基準測試中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase