Eurobert 210m Quality CL
自然言語とプログラミング言語のテキストデータ品質を自動評価するモデルで、統一モデルと双モデルの2つのソリューションを提供します。
ダウンロード数 19
リリース時間 : 3/18/2025
モデル概要
このモデルはスコアリングシステムによりテキストデータ品質を自動評価し、自然言語(フランス語、英語、スペイン語)とプログラミング言語(Python、Java、JavaScript、C/C++)をサポートします。統一モデルと独立モデルの2つのソリューションを提供し、様々なシナリオのニーズに対応します。
モデル特徴
多言語サポート
自然言語(フランス語、英語、スペイン語)とプログラミング言語(Python、Java、JavaScript、C/C++)の品質評価を同時にサポート
二重評価ソリューション
統一モデルと独立モデルの2つのソリューションを提供し、ニーズに応じて最適な評価方法を選択可能
有害コンテンツ識別
有害コンテンツ識別で優れた性能を発揮し、自然言語のF1スコアは0.93を達成
明確な分類体系
有害、低品質、中品質、高品質の4段階の分類レベルを提供し、理解と使用が容易
モデル能力
自然言語テキスト品質評価
プログラミング言語コード品質評価
有害コンテンツ検出
多言語サポート
使用事例
NLP前処理
テキストコーパス検証
NLPシステムに接続する前にテキストコーパスの品質を自動検証
NLPシステムの入力データ品質を向上
コミュニティコンテンツ管理
技術コミュニティコンテンツ評価
フォーラム、Stack Overflow、GitHubなどの技術コミュニティコンテンツの品質を評価
高品質なコンテンツの選別を支援
コード生成
コード品質評価
コード生成システムが出力するコードの品質を評価
コード生成システムの信頼性を向上
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98