O

Openlid V2

由laurievb開發
OpenLID-v2是一個高覆蓋、高性能的語言識別模型,支持200種語言變體,是OpenLID的改進版本。
下載量 273
發布時間 : 11/12/2024

模型概述

OpenLID-v2是一個文本分類模型,專門用於語言識別任務。它能夠準確識別200種語言變體,適用於多語言環境下的文本處理。

模型特點

高覆蓋語言支持
支持200種語言變體,包括許多低資源語言。
高性能
在FLORES+評估基準上表現優異,宏平均F1分數達到0.93。
標準化預處理
提供文本清理和標準化工具,顯著提升識別準確率。
開源數據集
訓練數據和模型完全開源,便於研究和改進。

模型能力

文本語言識別
多語言文本分類
低資源語言支持

使用案例

多語言文本處理
社交媒體內容分析
識別社交媒體帖子中的語言,便於內容分類和分析。
可準確識別200種語言變體
多語言搜索引擎
為搜索引擎提供語言識別功能,改善多語言搜索體驗。
低誤識別率(0.033%的假陽性率)
語言數據篩選
從大規模多語言數據集中篩選特定語言的內容。
高準確率(宏平均F1 0.93)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase