F

Fineweb Edu Classifier

由HuggingFaceFW開發
基於FineWeb數據集訓練的網頁教育價值評估分類器,用於篩選優質教育內容
下載量 150.77k
發布時間 : 5/6/2024

模型概述

該模型專門用於評估網頁內容的教育價值,基於45萬條Llama3標註的網頁樣本訓練,可對網頁內容進行0-5分的評分,幫助篩選高質量教育內容。

模型特點

高質量訓練數據
基於45萬條由LLama3-70B-instruct標註的網頁樣本訓練
精細評分體系
提供0-5分的精細評分,0分表示無教育價值,5分表示教育價值極高
優化訓練策略
凍結嵌入層和編碼器層,專注優化分類頭,學習率3e-4訓練20個epoch

模型能力

網頁內容教育價值評估
教育內容質量評分
教育內容篩選

使用案例

教育內容篩選
構建教育數據集
用於構建FineWeb-Edu教育數據集
已成功應用於FineWeb-Edu數據集構建
網頁內容質量評估
評估網頁內容的教育價值
F1分數達到82%(以3分為閾值)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase