L

Llm Data Textbook Quality Fasttext Classifier V1

kenhktsuiによって開発
fasttextを基に構築されたテキスト分類モデルで、テキストが教科書レベルのデータ品質に達しているかどうかを判断するために使用されます。大規模言語モデルのトレーニング時のデータフィルタリングツールとして利用可能です。
ダウンロード数 35
リリース時間 : 4/28/2024

モデル概要

このモデルはllm-data-textbook-quality-classifier-v1の最適化バージョンで、より高いF1スコアを獲得しただけでなく、CPU上で毎秒2000以上のサンプルを分類できます。

モデル特徴

高性能
CPU上で毎秒2000以上のサンプルを分類可能で、大規模データ処理に適しています。
高精度
トレーニングセットのF1スコアは0.8695、テストセットのF1スコアは0.8485で、優れた性能を発揮します。
教科書レベルの品質検出
教科書レベルのデータ品質に特化して最適化されており、高品質なトレーニングデータを効果的に選別できます。

モデル能力

テキスト品質分類
データフィルタリング
大規模テキスト処理

使用事例

データ前処理
大規模言語モデルトレーニングデータのフィルタリング
大規模言語モデルをトレーニングする前に、このモデルを使用して高品質な教科書レベルのデータを選別します。
モデルのトレーニング効果と生成品質の向上
コンテンツ品質評価
教育コンテンツの品質評価
教育関連のテキストが教科書レベルの品質基準に達しているかどうかを評価します。
高品質な教育コンテンツの識別に役立ちます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase