E

Eurobert 210m Quality CL

TempestTeamによって開発
自然言語とプログラミング言語のテキストデータ品質を自動評価するモデルで、統一モデルと双モデルの2つのソリューションを提供します。
ダウンロード数 19
リリース時間 : 3/18/2025

モデル概要

このモデルはスコアリングシステムによりテキストデータ品質を自動評価し、自然言語(フランス語、英語、スペイン語)とプログラミング言語(Python、Java、JavaScript、C/C++)をサポートします。統一モデルと独立モデルの2つのソリューションを提供し、様々なシナリオのニーズに対応します。

モデル特徴

多言語サポート
自然言語(フランス語、英語、スペイン語)とプログラミング言語(Python、Java、JavaScript、C/C++)の品質評価を同時にサポート
二重評価ソリューション
統一モデルと独立モデルの2つのソリューションを提供し、ニーズに応じて最適な評価方法を選択可能
有害コンテンツ識別
有害コンテンツ識別で優れた性能を発揮し、自然言語のF1スコアは0.93を達成
明確な分類体系
有害、低品質、中品質、高品質の4段階の分類レベルを提供し、理解と使用が容易

モデル能力

自然言語テキスト品質評価
プログラミング言語コード品質評価
有害コンテンツ検出
多言語サポート

使用事例

NLP前処理
テキストコーパス検証
NLPシステムに接続する前にテキストコーパスの品質を自動検証
NLPシステムの入力データ品質を向上
コミュニティコンテンツ管理
技術コミュニティコンテンツ評価
フォーラム、Stack Overflow、GitHubなどの技術コミュニティコンテンツの品質を評価
高品質なコンテンツの選別を支援
コード生成
コード品質評価
コード生成システムが出力するコードの品質を評価
コード生成システムの信頼性を向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase