ModernBERT-baseオープンソーステキスト分類モデル - arxivの新しいデータセットに基づく微調整、実用的かつ効率的

Modernbert Base Is New Arxiv Dataset

davanstrienによって開発

ModernBERT-baseをarxiv-new-datasetsデータセットでファインチューニングしたモデルで、主にテキスト分類タスクに使用されます

ダウンロード数 10.40k

リリース時間 : 4/25/2025

モデル概要

このモデルはModernBERT-baseをarxiv-new-datasetsデータセットでファインチューニングしたバージョンで、学術論文分類タスクに適しています。

高精度

評価データセットで94.5%の精度と94.39%のF1値を達成

最適化されたトレーニング

コサイン学習率スケジューラとラベル平滑化技術を採用し、トレーニングプロセスを最適化

学術分野に適応

arXiv論文データセットでトレーニングされており、学術テキスト処理に適しています

テキスト分類

学術論文分析

自然言語理解

学術研究

論文分類

arXiv学術論文を分類

精度94.5%

学術テキスト分析

学術論文の内容を分析し分類

トレーニング損失	エポック	ステップ	検証損失	正解率	F1値
0.5181	1.0	300	0.4495	0.8333	0.8051
0.3804	2.0	600	0.3134	0.93	0.9268
0.3083	3.0	900	0.3407	0.9233	0.9192
0.2449	4.0	1200	0.3304	0.9367	0.9370
0.219	5.0	1500	0.3293	0.94	0.9377
0.2095	6.0	1800	0.3735	0.9283	0.9294
0.205	7.0	2100	0.3220	0.945	0.9439
0.2029	8.0	2400	0.3404	0.9367	0.9338
0.2	9.0	2700	0.3431	0.9333	0.9330
0.1989	10.0	3000	0.3286	0.9383	0.9377
0.1996	11.0	3300	0.3339	0.9383	0.9365
0.1986	12.0	3600	0.3295	0.9433	0.9419