F

Fineweb Edu Classifier

由 HuggingFaceFW 开发
基于FineWeb数据集训练的网页教育价值评估分类器,用于筛选优质教育内容
下载量 150.77k
发布时间 : 5/6/2024

模型简介

该模型专门用于评估网页内容的教育价值,基于45万条Llama3标注的网页样本训练,可对网页内容进行0-5分的评分,帮助筛选高质量教育内容。

模型特点

高质量训练数据
基于45万条由LLama3-70B-instruct标注的网页样本训练
精细评分体系
提供0-5分的精细评分,0分表示无教育价值,5分表示教育价值极高
优化训练策略
冻结嵌入层和编码器层,专注优化分类头,学习率3e-4训练20个epoch

模型能力

网页内容教育价值评估
教育内容质量评分
教育内容筛选

使用案例

教育内容筛选
构建教育数据集
用于构建FineWeb-Edu教育数据集
已成功应用于FineWeb-Edu数据集构建
网页内容质量评估
评估网页内容的教育价值
F1分数达到82%(以3分为阈值)
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase