L

Language Detection

Developed by alexneakameni
基於BERT的多語言檢測模型,支持200種語言的文本分類任務
Downloads 1,210
Release Time : 2/13/2025

Model Overview

這是一個基於BERT架構的語言檢測模型,專門用於快速準確地識別文本的語言類型。模型在包含200種語言的1.21億條句子的數據集上訓練,具有高準確率和召回率。

Model Features

多語言支持
支持200種語言的檢測,包括主要歐洲語言、亞洲語言和非洲語言
高準確率
在測試集上達到0.9733的準確率,F1分數0.9733
數據增強
採用多種文本增強策略提高模型魯棒性,包括移除數字、打亂詞序等
高效架構
基於BERT的精簡架構,4層Transformer,適合快速推理

Model Capabilities

文本語言識別
多語言文本分類
短文本語言檢測
長文本語言檢測

Use Cases

內容管理
多語言內容分類
自動識別用戶生成內容的語言類型
準確率97.33%
翻譯系統
翻譯前語言檢測
在翻譯流程前自動檢測輸入文本語言
支持200種語言識別
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase