O

Openlid V2

由 laurievb 开发
OpenLID-v2是一个高覆盖、高性能的语言识别模型,支持200种语言变体,是OpenLID的改进版本。
下载量 273
发布时间 : 11/12/2024

模型简介

OpenLID-v2是一个文本分类模型,专门用于语言识别任务。它能够准确识别200种语言变体,适用于多语言环境下的文本处理。

模型特点

高覆盖语言支持
支持200种语言变体,包括许多低资源语言。
高性能
在FLORES+评估基准上表现优异,宏平均F1分数达到0.93。
标准化预处理
提供文本清理和标准化工具,显著提升识别准确率。
开源数据集
训练数据和模型完全开源,便于研究和改进。

模型能力

文本语言识别
多语言文本分类
低资源语言支持

使用案例

多语言文本处理
社交媒体内容分析
识别社交媒体帖子中的语言,便于内容分类和分析。
可准确识别200种语言变体
多语言搜索引擎
为搜索引擎提供语言识别功能,改善多语言搜索体验。
低误识别率(0.033%的假阳性率)
语言数据筛选
从大规模多语言数据集中筛选特定语言的内容。
高准确率(宏平均F1 0.93)
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase