O

Openlid V2

laurievbによって開発
OpenLID-v2は高カバレッジで高性能な言語識別モデルで、200の言語バリアントをサポートし、OpenLIDの改良版です。
ダウンロード数 273
リリース時間 : 11/12/2024

モデル概要

OpenLID-v2はテキスト分類モデルで、言語識別タスクに特化しています。200の言語バリアントを正確に識別でき、多言語環境でのテキスト処理に適しています。

モデル特徴

高カバレッジ言語サポート
200の言語バリアントをサポートし、多くの低リソース言語を含みます。
高性能
FLORES+評価ベンチマークで優れた性能を発揮し、マクロ平均F1スコアは0.93に達します。
標準化前処理
テキストクリーンアップと標準化ツールを提供し、識別精度を大幅に向上させます。
オープンソースデータセット
トレーニングデータとモデルは完全にオープンソースで、研究と改良が容易です。

モデル能力

テキスト言語識別
多言語テキスト分類
低リソース言語サポート

使用事例

多言語テキスト処理
ソーシャルメディアコンテンツ分析
ソーシャルメディアの投稿の言語を識別し、コンテンツの分類と分析を容易にします。
200の言語バリアントを正確に識別可能
多言語検索エンジン
検索エンジンに言語識別機能を提供し、多言語検索体験を改善します。
低い誤識別率(0.033%の偽陽性率)
言語データフィルタリング
大規模な多言語データセットから特定の言語のコンテンツをフィルタリングします。
高い精度(マクロ平均F1 0.93)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase