Eurobert 210m Quality CL
自然言語とプログラミング言語のテキストデータ品質を自動評価するモデルで、統一モデルと双モデルの2つのソリューションを提供します。
テキスト分類
Transformers Supports Multiple LanguagesOpen Source License:Apache-2.0#多言語品質評価#コード品質検出#有害コンテンツ識別

Downloads 19
Release Time : 3/18/2025
Model Overview
このモデルはスコアリングシステムによりテキストデータ品質を自動評価し、自然言語(フランス語、英語、スペイン語)とプログラミング言語(Python、Java、JavaScript、C/C++)をサポートします。統一モデルと独立モデルの2つのソリューションを提供し、様々なシナリオのニーズに対応します。
Model Features
多言語サポート
自然言語(フランス語、英語、スペイン語)とプログラミング言語(Python、Java、JavaScript、C/C++)の品質評価を同時にサポート
二重評価ソリューション
統一モデルと独立モデルの2つのソリューションを提供し、ニーズに応じて最適な評価方法を選択可能
有害コンテンツ識別
有害コンテンツ識別で優れた性能を発揮し、自然言語のF1スコアは0.93を達成
明確な分類体系
有害、低品質、中品質、高品質の4段階の分類レベルを提供し、理解と使用が容易
Model Capabilities
自然言語テキスト品質評価
プログラミング言語コード品質評価
有害コンテンツ検出
多言語サポート
Use Cases
NLP前処理
テキストコーパス検証
NLPシステムに接続する前にテキストコーパスの品質を自動検証
NLPシステムの入力データ品質を向上
コミュニティコンテンツ管理
技術コミュニティコンテンツ評価
フォーラム、Stack Overflow、GitHubなどの技術コミュニティコンテンツの品質を評価
高品質なコンテンツの選別を支援
コード生成
コード品質評価
コード生成システムが出力するコードの品質を評価
コード生成システムの信頼性を向上
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98