L

Langdetect

由ERCDiDip開發
基於XLM-RoBERTa-base微調的語言檢測模型,支持41種現代和中世紀語言的文本分類
下載量 6,687
發布時間 : 11/25/2022

模型概述

該模型用於語言檢測任務,能夠識別包括現代和中世紀語言在內的41種語言。適用於需要多語言文本分類的場景。

模型特點

多語言支持
支持41種現代和中世紀語言的檢測,包括一些罕見的古語言
高準確率
在測試集上達到99.59%的平均準確率
基於XLM-RoBERTa
利用強大的XLM-RoBERTa-base模型進行微調,具備優秀的跨語言表示能力

模型能力

文本分類
語言檢測
多語言處理

使用案例

文檔處理
歷史文獻語言識別
識別中世紀文獻的語言類型
準確識別古法語、拉丁語等中世紀語言
多語言內容分類
對包含多種語言的文本進行分類
準確區分41種支持的語言
學術研究
語言學分析
輔助語言學研究者分析文本語言特徵
提供高精度的語言識別結果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase