E

Eurobert 210m Quality CL

Developed by TempestTeam
自然言語とプログラミング言語のテキストデータ品質を自動評価するモデルで、統一モデルと双モデルの2つのソリューションを提供します。
Downloads 19
Release Time : 3/18/2025

Model Overview

このモデルはスコアリングシステムによりテキストデータ品質を自動評価し、自然言語(フランス語、英語、スペイン語)とプログラミング言語(Python、Java、JavaScript、C/C++)をサポートします。統一モデルと独立モデルの2つのソリューションを提供し、様々なシナリオのニーズに対応します。

Model Features

多言語サポート
自然言語(フランス語、英語、スペイン語)とプログラミング言語(Python、Java、JavaScript、C/C++)の品質評価を同時にサポート
二重評価ソリューション
統一モデルと独立モデルの2つのソリューションを提供し、ニーズに応じて最適な評価方法を選択可能
有害コンテンツ識別
有害コンテンツ識別で優れた性能を発揮し、自然言語のF1スコアは0.93を達成
明確な分類体系
有害、低品質、中品質、高品質の4段階の分類レベルを提供し、理解と使用が容易

Model Capabilities

自然言語テキスト品質評価
プログラミング言語コード品質評価
有害コンテンツ検出
多言語サポート

Use Cases

NLP前処理
テキストコーパス検証
NLPシステムに接続する前にテキストコーパスの品質を自動検証
NLPシステムの入力データ品質を向上
コミュニティコンテンツ管理
技術コミュニティコンテンツ評価
フォーラム、Stack Overflow、GitHubなどの技術コミュニティコンテンツの品質を評価
高品質なコンテンツの選別を支援
コード生成
コード品質評価
コード生成システムが出力するコードの品質を評価
コード生成システムの信頼性を向上
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase