L

Langdetect

ERCDiDipによって開発
XLM-RoBERTa-baseをファインチューニングした言語検出モデルで、41の現代および中世言語のテキスト分類をサポート
ダウンロード数 6,687
リリース時間 : 11/25/2022

モデル概要

このモデルは言語検出タスクに使用され、現代語と中世語を含む41言語を識別できます。多言語テキスト分類が必要なシナリオに適しています。

モデル特徴

多言語サポート
41の現代および中世言語の検出をサポートし、一部の珍しい古代言語も含む
高精度
テストセットで99.59%の平均精度を達成
XLM-RoBERTaベース
強力なXLM-RoBERTa-baseモデルをファインチューニングし、優れたクロスランゲージ表現能力を備える

モデル能力

テキスト分類
言語検出
多言語処理

使用事例

文書処理
歴史文書の言語識別
中世文書の言語タイプを識別
古フランス語、ラテン語などの中世言語を正確に識別
多言語コンテンツ分類
複数言語を含むテキストを分類
サポートする41言語を正確に区別
学術研究
言語学分析
言語学研究者がテキストの言語特徴を分析するのを支援
高精度な言語識別結果を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase