L

Llm Data Textbook Quality Fasttext Classifier V2

kenhktsuiによって開発
これはfasttextを基に構築された教育価値分類器で、ネットワークテキストが高い教育価値を持つかどうかを判断し、大規模言語モデル(LLM)の事前学習データ選別に適しています。
ダウンロード数 3,651
リリース時間 : 5/19/2024

モデル概要

この分類器はテキストの教育価値レベルを高、中、低の3段階で判断でき、特にLLMトレーニングデータの品質選別に適しています。

モデル特徴

効率的なCPU推論
fasttextを基に構築され、CPU上で毎秒2000以上のサンプルを分類可能で、リアルタイム使用に適しています
3段階教育価値評価
高、中、低の3つの教育価値レベルを提供し、二元分類よりも細かい評価が可能
量子化モデルサポート
量子化モデルバージョンmodel_quantized.binを提供し、推論効率を最適化

モデル能力

テキスト分類
教育価値評価
データ品質選別

使用事例

LLMトレーニングデータ選別
事前学習データフィルタリング
LLM事前学習前に高品質な教育価値を持つテキストデータを選別
トレーニングデータ品質を向上させ、モデル性能を改善
教育コンテンツ分析
教材内容評価
異なる教育材料の教育価値レベルを評価
高品質な教育コンテンツの識別を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase