🚀 FaBERT:基于波斯语博客预训练的BERT模型
FaBERT是一个基于波斯语的BERT基础模型,它在多样化的HmBlogs语料库上进行训练,该语料库涵盖了休闲和正式的波斯语文本。FaBERT专为自然语言处理任务而开发,是处理波斯语文本的强大解决方案。通过在各种自然语言理解(NLU)任务中的评估,FaBERT始终展现出显著的性能提升,同时模型规模紧凑。现在,FaBERT已在Hugging Face上发布,您可以轻松地将其集成到您的项目中。体验FaBERT在处理各种NLP任务时带来的高性能,且无需增加额外的复杂性。
🚀 快速开始
加载带有MLM头的模型
from transformers import AutoTokenizer, AutoModelForMaskedLM
tokenizer = AutoTokenizer.from_pretrained("sbunlp/fabert")
model = AutoModelForMaskedLM.from_pretrained("sbunlp/fabert")
下游任务
与原始的英文BERT类似,FaBERT可以在许多下游任务上进行微调。(https://huggingface.co/docs/transformers/en/training )
波斯语数据集的示例可在我们的GitHub仓库中找到。
⚠️ 重要提示
请确保使用默认的快速分词器。
✨ 主要特性
- 在多样化的HmBlogs语料库上进行预训练,该语料库包含超过50GB来自波斯语博客的文本。
- 在各种下游NLP任务中表现出色。
- 采用BERT架构,拥有1.24亿个参数。
📚 详细文档
模型详情
FaBERT是一个基于波斯语的BERT基础模型,在多样化的HmBlogs语料库上进行训练,该语料库涵盖了休闲和正式的波斯语文本。它专为自然语言处理任务而开发,是处理波斯语文本的强大解决方案。通过在各种自然语言理解(NLU)任务中的评估,FaBERT始终展现出显著的性能提升,同时模型规模紧凑。现在,FaBERT已在Hugging Face上发布,您可以轻松地将其集成到您的项目中。体验FaBERT在处理各种NLP任务时带来的高性能,且无需增加额外的复杂性。
训练详情
FaBERT使用MLM(WWM)目标进行预训练,在验证集上的困惑度为7.76。
超参数 |
值 |
批量大小 |
32 |
优化器 |
Adam |
学习率 |
6e - 5 |
权重衰减 |
0.01 |
总步数 |
1800万 |
热身步数 |
180万 |
精度格式 |
TF32 |
评估
以下是FaBERT模型的一些关键性能结果:
情感分析
任务 |
FaBERT |
ParsBERT |
XLM - R |
MirasOpinion |
87.51 |
86.73 |
84.92 |
MirasIrony |
74.82 |
71.08 |
75.51 |
DeepSentiPers |
79.85 |
74.94 |
79.00 |
命名实体识别
任务 |
FaBERT |
ParsBERT |
XLM - R |
PEYMA |
91.39 |
91.24 |
90.91 |
ParsTwiner |
82.22 |
81.13 |
79.50 |
MultiCoNER v2 |
57.92 |
58.09 |
51.47 |
问答
任务 |
FaBERT |
ParsBERT |
XLM - R |
ParsiNLU |
55.87 |
44.89 |
42.55 |
PQuAD |
87.34 |
86.89 |
87.60 |
PCoQA |
53.51 |
50.96 |
51.12 |
自然语言推理与QQP
任务 |
FaBERT |
ParsBERT |
XLM - R |
FarsTail |
84.45 |
82.52 |
83.50 |
SBU - NLI |
66.65 |
58.41 |
58.85 |
ParsiNLU QQP |
82.62 |
77.60 |
79.74 |
更多详细的性能分析请参考论文。
如何引用
如果您在研究或项目中使用了FaBERT,请使用以下BibTeX进行引用:
@article{masumi2024fabert,
title={FaBERT: Pre-training BERT on Persian Blogs},
author={Masumi, Mostafa and Majd, Seyed Soroush and Shamsfard, Mehrnoush and Beigy, Hamid},
journal={arXiv preprint arXiv:2402.06617},
year={2024}
}
有用链接
示例
示例标题 |
文本 |
Poetry 1 |
"ز سوزناکی گفتار من [MASK] بگریست" |
Poetry 2 |
"نظر از تو برنگیرم همه [MASK] تا بمیرم که تو در دلم نشستی و سر مقام داری" |
Poetry 3 |
"هر ساعتم اندرون بجوشد [MASK] را وآگاهی نیست مردم بیرون را" |
Poetry 4 |
"غلام همت آن رند عافیت سوزم که در گدا صفتی [MASK] داند" |
Informal 1 |
"این [MASK] اولشه." |
Informal 2 |
"دیگه خسته شدم! [MASK] اینم شد کار؟!" |
Informal 3 |
"فکر نکنم به موقع برسیم. بهتره [MASK] این یکی بشیم." |
Informal 4 |
"تا صبح بیدار موندم و داشتم برای [MASK] آماده می شدم." |
Formal 1 |
"زندگی بدون [MASK] خستهکننده است." |
Formal 2 |
"در حکم اولیه این شرکت مجاز به فعالیت شد ولی پس از بررسی مجدد، مجوز این شرکت [MASK] شد." |