🚀 lt_core_news_lg 立陶宛语模型
lt_core_news_lg
是一个针对 CPU 进行优化的立陶宛语处理管道模型,可用于词性标注、命名实体识别、句法分析等自然语言处理任务。
🚀 快速开始
详情请访问:https://spacy.io/models/lt#lt_core_news_lg
✨ 主要特性
- 专为 CPU 优化,处理效率高。
- 包含多种组件,如
tok2vec
、morphologizer
、tagger
等,可完成多种自然语言处理任务。
📚 详细文档
模型信息
属性 |
详情 |
模型名称 |
lt_core_news_lg |
版本 |
3.7.0 |
spaCy 版本要求 |
>=3.7.0,<3.8.0 |
默认管道 |
tok2vec , morphologizer , tagger , parser , lemmatizer , attribute_ruler , ner |
组件 |
tok2vec , morphologizer , tagger , parser , lemmatizer , senter , attribute_ruler , ner |
向量 |
500000 个键,500000 个唯一向量(300 维) |
来源 |
UD Lithuanian ALKSNIS v2.8 (Utka, Andrius; Rimkutė, Erika; Bielinskienė, Agnė; Kovalevskaitė, Jolanta; Boizou, Loïc; Aleksandravičiūtė, Gabrielė; Brokaitė, Kristina; Zeman, Daniel; Perkova, Natalia; Griciūtė, Bernadeta) TokenMill NER Corpus (TokenMill) Explosion fastText Vectors (cbow, OSCAR Common Crawl + Wikipedia) (Explosion) |
许可证 |
CC BY-SA 4.0 |
作者 |
Explosion |
标签方案
查看标签方案(4 个组件共 1669 个标签)
组件 |
标签 |
morphologizer |
Definite=Ind|Gender=Neut|POS=VERB|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Pass , POS=VERB|Polarity=Pos|VerbForm=Inf , Case=Gen|Definite=Def|Degree=Pos|Gender=Fem|Number=Plur|POS=ADJ , ... |
评估指标
任务 |
指标 |
值 |
NER |
NER Precision |
0.7492163009 |
NER |
NER Recall |
0.8369184592 |
NER |
NER F Score |
0.7906427221 |
TAG |
TAG (XPOS) Accuracy |
0.8803910542 |
POS |
POS (UPOS) Accuracy |
0.9519401306 |
MORPH |
Morph (UFeats) Accuracy |
0.8889081156 |
LEMMA |
Lemma Accuracy |
0.8613069238 |
UNLABELED_DEPENDENCIES |
Unlabeled Attachment Score (UAS) |
0.7444831591 |
LABELED_DEPENDENCIES |
Labeled Attachment Score (LAS) |
0.6760280843 |
SENTS |
Sentences F-Score |
0.8437246964 |
📄 许可证
本模型采用 CC BY-SA 4.0
许可证。