E

Eurobert 210m Quality

TempestTeamによって開発
自然言語とプログラミング言語のテキストデータ品質を自動評価するモデルで、統一モデルと独立モデルの2つのソリューションを提供します。
ダウンロード数 26
リリース時間 : 3/18/2025

モデル概要

このモデルはスコアリングシステムによりテキストデータ品質を自動評価し、自然言語(フランス語、英語、スペイン語)とプログラミング言語(Python、Java、JavaScript、C/C++)をサポート、有害コンテンツを識別し品質レベルを分類できます。

モデル特徴

多言語サポート
自然言語(フランス語、英語、スペイン語)とプログラミング言語(Python、Java、JavaScript、C/C++)の品質評価を同時にサポートします。
デュアルモデルソリューション
統一モデルと独立モデルの2つのソリューションを提供し、ニーズに応じて最適な評価方法を選択できます。
有害コンテンツ識別
有害コンテンツを効率的に識別し、f1スコアは自然言語で0.93、プログラミング言語で0.79を達成します。
品質レベル分類
テキストデータを有害コンテンツ、低品質、中品質、高品質の4段階に分類し、後続処理を容易にします。

モデル能力

自然言語テキスト品質評価
プログラミング言語コード品質評価
有害コンテンツ識別
品質レベル分類

使用事例

NLPプロセス
テキストコーパス自動検証
NLPプロセスでテキストコーパスの品質を自動検証し、モデルトレーニング効果を向上させます。
約82%の精度(自然言語)
コミュニティコンテンツ管理
フォーラムコンテンツ品質評価
フォーラムやStack Overflowなどのコミュニティコンテンツ品質を自動評価し、コンテンツ管理を支援します。
有害コンテンツ識別f1スコア0.93(自然言語)
コード生成
コード品質評価
コード生成プロセスで生成されたコードの品質を自動評価し、コードの可用性を確保します。
約63%の精度(プログラミング言語)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase