🚀 ru_core_news_lg 俄语语言处理模型
ru_core_news_lg
是一款针对 CPU 进行优化的俄语处理管道模型。它能够高效地处理俄语相关的自然语言处理任务,如命名实体识别、词性标注等,为俄语的文本分析提供了强大的支持。
✨ 主要特性
- 多任务支持:涵盖了命名实体识别(NER)、词性标注(POS)、形态分析(MORPH)等多种 token 分类任务。
- 高精度表现:在各项任务中都取得了较高的准确率,如 NER 精度达到 0.9524209818 。
- CPU 优化:专门针对 CPU 进行了优化,能够在普通 CPU 环境下高效运行。
📚 详细文档
模型指标
任务名称 |
指标名称 |
指标类型 |
指标值 |
NER |
NER Precision |
precision |
0.9524209818 |
NER |
NER Recall |
recall |
0.9535431745 |
NER |
NER F Score |
f_score |
0.9529817478 |
TAG |
TAG (XPOS) Accuracy |
accuracy |
0.989280677 |
POS |
POS (UPOS) Accuracy |
accuracy |
0.989280677 |
MORPH |
Morph (UFeats) Accuracy |
accuracy |
0.9749177029 |
LEMMA |
Lemma Accuracy |
accuracy |
2.15295e - 05 |
UNLABELED_DEPENDENCIES |
Unlabeled Attachment Score (UAS) |
f_score |
0.962198055 |
LABELED_DEPENDENCIES |
Labeled Attachment Score (LAS) |
f_score |
0.9511948091 |
SENTS |
Sentences F - Score |
f_score |
0.9985729236 |
模型详情
详情请见:https://spacy.io/models/ru#ru_core_news_lg
模型信息
属性 |
详情 |
模型类型 |
ru_core_news_lg |
版本 |
3.7.0 |
spaCy 版本要求 |
>=3.7.0,<3.8.0 |
默认管道 |
tok2vec , morphologizer , parser , attribute_ruler , lemmatizer , ner |
组件 |
tok2vec , morphologizer , parser , senter , attribute_ruler , lemmatizer , ner |
向量 |
500002 个键,500002 个唯一向量(300 维) |
数据源 |
Nerus (Alexander Kukushkin) Navec (Alexander Kukushkin) |
许可证 |
MIT |
作者 |
Explosion |
标签方案
查看标签方案(3 个组件共 900 个标签)
组件 |
标签 |
morphologizer |
Case=Nom|Degree=Pos|Number=Plur|POS=ADJ , Animacy=Anim|Case=Nom|Gender=Masc|Number=Plur|POS=NOUN , Aspect=Perf|Mood=Ind|Number=Plur|POS=VERB|Tense=Past|VerbForm=Fin|Voice=Act , ...(此处省略大量标签) |
📄 许可证
本模型采用 MIT
许可证。