🚀 FaBERT:基於波斯語博客預訓練的BERT模型
FaBERT是一個基於波斯語的BERT基礎模型,它在多樣化的HmBlogs語料庫上進行訓練,該語料庫涵蓋了休閒和正式的波斯語文本。FaBERT專為自然語言處理任務而開發,是處理波斯語文本的強大解決方案。通過在各種自然語言理解(NLU)任務中的評估,FaBERT始終展現出顯著的性能提升,同時模型規模緊湊。現在,FaBERT已在Hugging Face上發佈,您可以輕鬆地將其集成到您的項目中。體驗FaBERT在處理各種NLP任務時帶來的高性能,且無需增加額外的複雜性。
🚀 快速開始
加載帶有MLM頭的模型
from transformers import AutoTokenizer, AutoModelForMaskedLM
tokenizer = AutoTokenizer.from_pretrained("sbunlp/fabert")
model = AutoModelForMaskedLM.from_pretrained("sbunlp/fabert")
下游任務
與原始的英文BERT類似,FaBERT可以在許多下游任務上進行微調。(https://huggingface.co/docs/transformers/en/training )
波斯語數據集的示例可在我們的GitHub倉庫中找到。
⚠️ 重要提示
請確保使用默認的快速分詞器。
✨ 主要特性
- 在多樣化的HmBlogs語料庫上進行預訓練,該語料庫包含超過50GB來自波斯語博客的文本。
- 在各種下游NLP任務中表現出色。
- 採用BERT架構,擁有1.24億個參數。
📚 詳細文檔
模型詳情
FaBERT是一個基於波斯語的BERT基礎模型,在多樣化的HmBlogs語料庫上進行訓練,該語料庫涵蓋了休閒和正式的波斯語文本。它專為自然語言處理任務而開發,是處理波斯語文本的強大解決方案。通過在各種自然語言理解(NLU)任務中的評估,FaBERT始終展現出顯著的性能提升,同時模型規模緊湊。現在,FaBERT已在Hugging Face上發佈,您可以輕鬆地將其集成到您的項目中。體驗FaBERT在處理各種NLP任務時帶來的高性能,且無需增加額外的複雜性。
訓練詳情
FaBERT使用MLM(WWM)目標進行預訓練,在驗證集上的困惑度為7.76。
超參數 |
值 |
批量大小 |
32 |
優化器 |
Adam |
學習率 |
6e - 5 |
權重衰減 |
0.01 |
總步數 |
1800萬 |
熱身步數 |
180萬 |
精度格式 |
TF32 |
評估
以下是FaBERT模型的一些關鍵性能結果:
情感分析
任務 |
FaBERT |
ParsBERT |
XLM - R |
MirasOpinion |
87.51 |
86.73 |
84.92 |
MirasIrony |
74.82 |
71.08 |
75.51 |
DeepSentiPers |
79.85 |
74.94 |
79.00 |
命名實體識別
任務 |
FaBERT |
ParsBERT |
XLM - R |
PEYMA |
91.39 |
91.24 |
90.91 |
ParsTwiner |
82.22 |
81.13 |
79.50 |
MultiCoNER v2 |
57.92 |
58.09 |
51.47 |
問答
任務 |
FaBERT |
ParsBERT |
XLM - R |
ParsiNLU |
55.87 |
44.89 |
42.55 |
PQuAD |
87.34 |
86.89 |
87.60 |
PCoQA |
53.51 |
50.96 |
51.12 |
自然語言推理與QQP
任務 |
FaBERT |
ParsBERT |
XLM - R |
FarsTail |
84.45 |
82.52 |
83.50 |
SBU - NLI |
66.65 |
58.41 |
58.85 |
ParsiNLU QQP |
82.62 |
77.60 |
79.74 |
更多詳細的性能分析請參考論文。
如何引用
如果您在研究或項目中使用了FaBERT,請使用以下BibTeX進行引用:
@article{masumi2024fabert,
title={FaBERT: Pre-training BERT on Persian Blogs},
author={Masumi, Mostafa and Majd, Seyed Soroush and Shamsfard, Mehrnoush and Beigy, Hamid},
journal={arXiv preprint arXiv:2402.06617},
year={2024}
}
有用鏈接
示例
示例標題 |
文本 |
Poetry 1 |
"ز سوزناکی گفتار من [MASK] بگریست" |
Poetry 2 |
"نظر از تو برنگیرم همه [MASK] تا بمیرم که تو در دلم نشستی و سر مقام داری" |
Poetry 3 |
"هر ساعتم اندرون بجوشد [MASK] را وآگاهی نیست مردم بیرون را" |
Poetry 4 |
"غلام همت آن رند عافیت سوزم که در گدا صفتی [MASK] داند" |
Informal 1 |
"این [MASK] اولشه." |
Informal 2 |
"دیگه خسته شدم! [MASK] اینم شد کار؟!" |
Informal 3 |
"فکر نکنم به موقع برسیم. بهتره [MASK] این یکی بشیم." |
Informal 4 |
"تا صبح بیدار موندم و داشتم برای [MASK] آماده می شدم." |
Formal 1 |
"زندگی بدون [MASK] خستهکننده است." |
Formal 2 |
"در حکم اولیه این شرکت مجاز به فعالیت شد ولی پس از بررسی مجدد، مجوز این شرکت [MASK] شد." |