🚀 ru_core_news_lg 俄語語言處理模型
ru_core_news_lg
是一款針對 CPU 進行優化的俄語處理管道模型。它能夠高效地處理俄語相關的自然語言處理任務,如命名實體識別、詞性標註等,為俄語的文本分析提供了強大的支持。
✨ 主要特性
- 多任務支持:涵蓋了命名實體識別(NER)、詞性標註(POS)、形態分析(MORPH)等多種 token 分類任務。
- 高精度表現:在各項任務中都取得了較高的準確率,如 NER 精度達到 0.9524209818 。
- CPU 優化:專門針對 CPU 進行了優化,能夠在普通 CPU 環境下高效運行。
📚 詳細文檔
模型指標
任務名稱 |
指標名稱 |
指標類型 |
指標值 |
NER |
NER Precision |
precision |
0.9524209818 |
NER |
NER Recall |
recall |
0.9535431745 |
NER |
NER F Score |
f_score |
0.9529817478 |
TAG |
TAG (XPOS) Accuracy |
accuracy |
0.989280677 |
POS |
POS (UPOS) Accuracy |
accuracy |
0.989280677 |
MORPH |
Morph (UFeats) Accuracy |
accuracy |
0.9749177029 |
LEMMA |
Lemma Accuracy |
accuracy |
2.15295e - 05 |
UNLABELED_DEPENDENCIES |
Unlabeled Attachment Score (UAS) |
f_score |
0.962198055 |
LABELED_DEPENDENCIES |
Labeled Attachment Score (LAS) |
f_score |
0.9511948091 |
SENTS |
Sentences F - Score |
f_score |
0.9985729236 |
模型詳情
詳情請見:https://spacy.io/models/ru#ru_core_news_lg
模型信息
屬性 |
詳情 |
模型類型 |
ru_core_news_lg |
版本 |
3.7.0 |
spaCy 版本要求 |
>=3.7.0,<3.8.0 |
默認管道 |
tok2vec , morphologizer , parser , attribute_ruler , lemmatizer , ner |
組件 |
tok2vec , morphologizer , parser , senter , attribute_ruler , lemmatizer , ner |
向量 |
500002 個鍵,500002 個唯一向量(300 維) |
數據源 |
Nerus (Alexander Kukushkin) Navec (Alexander Kukushkin) |
許可證 |
MIT |
作者 |
Explosion |
標籤方案
查看標籤方案(3 個組件共 900 個標籤)
組件 |
標籤 |
morphologizer |
Case=Nom|Degree=Pos|Number=Plur|POS=ADJ , Animacy=Anim|Case=Nom|Gender=Masc|Number=Plur|POS=NOUN , Aspect=Perf|Mood=Ind|Number=Plur|POS=VERB|Tense=Past|VerbForm=Fin|Voice=Act , ...(此處省略大量標籤) |
📄 許可證
本模型採用 MIT
許可證。