L

Language Detection

alexneakameniによって開発
BERTベースの多言語検出モデルで、200言語のテキスト分類タスクをサポート
ダウンロード数 1,210
リリース時間 : 2/13/2025

モデル概要

これはBERTアーキテクチャに基づく言語検出モデルで、テキストの言語タイプを迅速かつ正確に識別するために特別に設計されています。モデルは200言語を含む1億2100万文のデータセットでトレーニングされ、高い精度と再現率を有しています。

モデル特徴

多言語サポート
主要なヨーロッパ言語、アジア言語、アフリカ言語を含む200言語の検出をサポート
高精度
テストセットで0.9733の精度、F1スコア0.9733を達成
データ拡張
数字の削除、語順のシャッフルなど、複数のテキスト拡張戦略を採用してモデルのロバスト性を向上
効率的なアーキテクチャ
BERTベースの軽量アーキテクチャ、4層Transformerで高速推論に適している

モデル能力

テキスト言語識別
多言語テキスト分類
短文言語検出
長文言語検出

使用事例

コンテンツ管理
多言語コンテンツ分類
ユーザー生成コンテンツの言語タイプを自動識別
精度97.33%
翻訳システム
翻訳前言語検出
翻訳プロセス前に入力テキストの言語を自動検出
200言語識別をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase