Nl Core News Md
模型概述
這是一箇中等大小的荷蘭語處理模型,基於spaCy框架開發,適用於各種荷蘭語文本處理任務。模型包含完整的自然語言處理流程,能夠執行分詞、詞性標註、依存分析、命名實體識別等任務。
模型特點
CPU優化
專門針對CPU使用進行了優化,適合在沒有GPU的環境中部署
全面NLP流程
包含完整的自然語言處理組件,從分詞到命名實體識別一應俱全
預訓練向量
包含20000個300維的預訓練詞向量,提升語義理解能力
模型能力
荷蘭語分詞
詞性標註
依存句法分析
命名實體識別
詞形還原
句子分割
形態分析
使用案例
文本分析
荷蘭語文本預處理
為荷蘭語文本分析任務提供預處理功能
準確率高達96.39%(UPOS詞性標註)
信息提取
從荷蘭語文本中提取命名實體(人物、地點、組織等)
F1值75.28%
語言學研究
荷蘭語語法分析
分析荷蘭語句子的語法結構和依存關係
依存分析UAS 86.82%,LAS 82.13%
🚀 nl_core_news_md 荷蘭語語言模型
nl_core_news_md
是一個針對 CPU 進行優化的荷蘭語處理管道,它能夠高效地完成詞法分析、詞性標註、命名實體識別等自然語言處理任務,為荷蘭語相關的文本處理提供強大支持。
🚀 快速開始
詳情請訪問:https://spacy.io/models/nl#nl_core_news_md
✨ 主要特性
- 專為 CPU 優化,在 CPU 上能高效運行。
- 包含多個組件,如
tok2vec
、morphologizer
、tagger
等,可完成多種自然語言處理任務。
📚 詳細文檔
模型信息
屬性 | 詳情 |
---|---|
模型名稱 | nl_core_news_md |
版本 | 3.7.0 |
spaCy 版本要求 | >=3.7.0,<3.8.0 |
默認管道 | tok2vec , morphologizer , tagger , parser , lemmatizer , attribute_ruler , ner |
組件 | tok2vec , morphologizer , tagger , parser , lemmatizer , senter , attribute_ruler , ner |
向量 | 500000 個鍵,20000 個唯一向量(300 維) |
來源 | UD Dutch LassySmall v2.8 (Bouma, Gosse; van Noord, Gertjan) Dutch NER Annotations for UD LassySmall (NLP Town) UD Dutch Alpino v2.8 (Zeman, Daniel; Žabokrtský, Zdeněk; Bouma, Gosse; van Noord, Gertjan) Explosion fastText Vectors (cbow, OSCAR Common Crawl + Wikipedia) (Explosion) |
許可證 | CC BY-SA 4.0 |
作者 | Explosion |
標籤方案
查看標籤方案(4 個組件共 323 個標籤)
組件 | 標籤 |
---|---|
morphologizer |
POS=PRON|Person=3|PronType=Dem , Number=Sing|POS=AUX|Tense=Pres|VerbForm=Fin , POS=ADV , POS=VERB|VerbForm=Part , POS=PUNCT , Number=Sing|POS=AUX|Tense=Past|VerbForm=Fin , POS=ADP , POS=NUM , Number=Plur|POS=NOUN , POS=VERB|VerbForm=Inf , POS=SCONJ , Definite=Def|POS=DET , Gender=Com|Number=Sing|POS=NOUN , Number=Sing|POS=VERB|Tense=Pres|VerbForm=Fin , Degree=Pos|POS=ADJ , Gender=Neut|Number=Sing|POS=PROPN , Gender=Com|Number=Sing|POS=PROPN , POS=AUX|VerbForm=Inf , Number=Sing|POS=VERB|Tense=Past|VerbForm=Fin , POS=DET , Gender=Neut|Number=Sing|POS=NOUN , POS=PRON|Person=3|PronType=Prs , POS=CCONJ , Number=Plur|POS=VERB|Tense=Pres|VerbForm=Fin , POS=PRON|Person=3|PronType=Ind , Degree=Cmp|POS=ADJ , Case=Nom|POS=PRON|Person=1|PronType=Prs , Definite=Ind|POS=DET , Case=Nom|POS=PRON|Person=3|PronType=Prs , POS=PRON|Person=3|Poss=Yes|PronType=Prs , Number=Plur|POS=AUX|Tense=Pres|VerbForm=Fin , POS=PRON|PronType=Rel , Case=Acc|POS=PRON|Person=1|PronType=Prs , Number=Plur|POS=VERB|Tense=Past|VerbForm=Fin , Gender=Com,Neut|Number=Sing|POS=NOUN , Case=Acc|POS=PRON|Person=3|PronType=Prs|Reflex=Yes , Case=Acc|POS=PRON|Person=3|PronType=Prs , POS=PROPN , POS=PRON|PronType=Ind , POS=PRON|Person=3|PronType=Int , Case=Acc|POS=PRON|PronType=Rcp , Number=Plur|POS=AUX|Tense=Past|VerbForm=Fin , Number=Sing|POS=NOUN , POS=PRON|Person=1|Poss=Yes|PronType=Prs , POS=SYM , Abbr=Yes|POS=X , Gender=Com,Neut|Number=Sing|POS=PROPN , Degree=Sup|POS=ADJ , POS=ADJ , Number=Sing|POS=PROPN , POS=PRON|PronType=Dem , POS=AUX|VerbForm=Part , POS=SPACE , POS=PRON|Person=3|PronType=Rel , Number=Plur|POS=PROPN , POS=PRON|Person=2|Poss=Yes|PronType=Prs , Case=Dat|POS=PRON|PronType=Dem , Case=Nom|POS=PRON|Person=2|PronType=Prs , POS=INTJ , Case=Acc|POS=PRON|Person=2|PronType=Prs , Case=Gen|POS=PRON|Person=3|Poss=Yes|PronType=Prs , POS=PRON|PronType=Int , POS=PRON|Person=2|PronType=Prs , POS=PRON|Person=3 , Case=Gen|POS=PRON|Person=2|PronType=Prs , POS=X |
tagger |
ADJ|nom|basis|met-e|mv-n , ADJ|nom|basis|met-e|zonder-n|bijz , ADJ|nom|basis|met-e|zonder-n|stan , ADJ|nom|basis|zonder|mv-n , ADJ|nom|basis|zonder|zonder-n , ADJ|nom|comp|met-e|mv-n , ADJ|nom|comp|met-e|zonder-n|stan , ADJ|nom|sup|met-e|mv-n , ADJ|nom|sup|met-e|zonder-n|bijz , ADJ|nom|sup|met-e|zonder-n|stan , ADJ|nom|sup|zonder|zonder-n , ADJ|postnom|basis|met-s , ADJ|postnom|basis|zonder , ADJ|postnom|comp|met-s , ADJ|prenom|basis|met-e|bijz , ADJ|prenom|basis|met-e|stan , ADJ|prenom|basis|zonder , ADJ|prenom|comp|met-e|stan , ADJ|prenom|comp|zonder , ADJ|prenom|sup|met-e|stan , ADJ|prenom|sup|zonder , ADJ|vrij|basis|zonder , ADJ|vrij|comp|zonder , ADJ|vrij|dim|zonder , ADJ|vrij|sup|zonder , BW , LET , LID|bep|dat|evmo , LID|bep|gen|evmo , LID|bep|gen|rest3 , LID|bep|stan|evon , LID|bep|stan|rest , LID|onbep|stan|agr , N|eigen|ev|basis|gen , N|eigen|ev|basis|genus|stan , N|eigen|ev|basis|onz|stan , N|eigen|ev|basis|zijd|stan , N|eigen|ev|dim|onz|stan , N|eigen|mv|basis , N|soort|ev|basis|dat , N|soort|ev|basis|gen , N|soort|ev|basis|genus|stan , N|soort|ev|basis|onz|stan , N|soort|ev|basis|zijd|stan , N|soort|ev|dim|onz|stan , N|soort|mv|basis , N|soort|mv|dim , SPEC|afgebr , SPEC|afk , SPEC|deeleigen , SPEC|enof , SPEC|meta , SPEC|symb , SPEC|vreemd , TSW , TW|hoofd|nom|mv-n|basis , TW|hoofd|nom|mv-n|dim , TW|hoofd|nom|zonder-n|basis , TW|hoofd|nom|zonder-n|dim , TW|hoofd|prenom|stan , TW|hoofd|vrij , TW|rang|nom|mv-n , TW|rang|nom|zonder-n , TW|rang|prenom|stan , VG|neven , VG|onder , VNW|aanw|adv-pron|obl|vol|3o|getal , VNW|aanw|adv-pron|stan|red|3|getal , VNW|aanw|det|dat|nom|met-e|zonder-n , VNW|aanw|det|dat|prenom|met-e|evmo , VNW|aanw|det|gen|prenom|met-e|rest3 , VNW|aanw|det|stan|nom|met-e|mv-n , VNW|aanw|det|stan|nom|met-e|zonder-n , VNW|aanw|det|stan|prenom|met-e|rest , VNW|aanw|det|stan|prenom|zonder|agr , VNW|aanw|det|stan|prenom|zonder|evon , VNW|aanw|det|stan|prenom|zonder|rest , VNW|aanw|det|stan|vrij|zonder , VNW|aanw|pron|gen|vol|3m|ev , VNW|aanw|pron|stan|vol|3o|ev , VNW|aanw|pron|stan|vol|3|getal , VNW|betr|det|stan|nom|met-e|zonder-n , VNW|betr|det|stan|nom|zonder|zonder-n , VNW|betr|pron|stan|vol|3|ev , VNW|betr|pron|stan|vol|persoon|getal , VNW|bez|det|gen|vol|3|ev|prenom|met-e|rest3 , VNW|bez|det|stan|nadr|2v|mv|prenom|zonder|agr , VNW|bez|det|stan|red|1|ev|prenom|zonder|agr , VNW|bez|det|stan|red|2v|ev|prenom|zonder|agr , VNW|bez|det|stan|red|3|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|1|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|1|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|1|mv|prenom|met-e|rest , VNW|bez|det|stan|vol|1|mv|prenom|zonder|evon , VNW|bez|det|stan|vol|2v|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|2|getal|prenom|zonder|agr , VNW|bez|det|stan|vol|3m|ev|nom|met-e|zonder-n , VNW|bez|det|stan|vol|3m|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|3p|mv|prenom|met-e|rest , VNW|bez|det|stan|vol|3v|ev|nom|met-e|zonder-n , VNW|bez|det|stan|vol|3v|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|3|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|3|mv|prenom|zonder|agr , VNW|excl|pron|stan|vol|3|getal , VNW|onbep|adv-pron|gen|red|3|getal , VNW|onbep|adv-pron|obl|vol|3o|getal , VNW|onbep|det|stan|nom|met-e|mv-n , VNW|onbep|det|stan|nom|met-e|zonder-n , VNW|onbep|det|stan|nom|zonder|zonder-n , VNW|onbep|det|stan|prenom|met-e|agr , VNW|onbep|det|stan|prenom|met-e|evz , VNW|onbep|det|stan|prenom|met-e|mv , VNW|onbep|det|stan|prenom|met-e|rest , VNW|onbep|det|stan|prenom|zonder|agr , VNW|onbep|det|stan|prenom|zonder|evon , VNW|onbep|det|stan|vrij|zonder , VNW|onbep|grad|gen|nom|met-e|mv-n|basis , VNW|onbep|grad|stan|nom|met-e|mv-n|basis , VNW|onbep|grad|stan|nom|met-e|mv-n|sup , VNW|onbep|grad|stan|nom|met-e|zonder-n|basis , VNW|onbep|grad|stan|nom|met-e|zonder-n|sup , VNW|onbep|grad|stan|prenom|met-e|agr|basis , VNW|onbep|grad|stan|prenom|met-e|agr|comp , VNW|onbep|grad|stan|prenom|met-e|agr|sup , VNW|onbep|grad|stan|prenom|met-e|mv|basis , VNW|onbep|grad|stan|prenom|zonder|agr|basis , VNW|onbep|grad|stan|prenom|zonder|agr|comp , VNW|onbep|grad|stan|vrij|zonder|basis , VNW|onbep|grad|stan|vrij|zonder|comp , VNW|onbep|grad|stan|vrij|zonder|sup , VNW|onbep|pron|gen|vol|3p|ev , VNW|onbep|pron|stan|vol|3o|ev , VNW|onbep|pron|stan|vol|3p|ev , VNW|pers|pron|gen|vol|2|getal , VNW|pers|pron|nomin|nadr|3m|ev|masc , VNW|pers|pron|nomin|nadr|3v|ev|fem , VNW|pers|pron|nomin|red|1|mv , VNW|pers|pron|nomin|red|2v|ev , VNW|pers|pron|nomin|red|2|getal , VNW|pers|pron|nomin|red|3p|ev|masc , VNW|pers|pron|nomin|red|3|ev|masc , VNW|pers|pron|nomin|vol|1|ev , VNW|pers|pron|nomin|vol|1|mv , VNW|pers|pron|nomin|vol|2b|getal , VNW|pers|pron|nomin|vol|2v|ev , VNW|pers|pron|nomin|vol|2|getal , VNW|pers|pron|nomin|vol|3p|mv , VNW|pers|pron|nomin|vol|3v|ev|fem , VNW|pers|pron|nomin|vol|3|ev|masc , VNW|pers|pron|obl|nadr|3m|ev|masc , VNW|pers|pron|obl|red|3|ev|masc , VNW|pers|pron|obl|vol|2v|ev , VNW|pers|pron|obl|vol|3p|mv , VNW|pers|pron|obl|vol|3|ev|masc , VNW|pers|pron|obl|vol|3|getal|fem , VNW|pers|pron|stan|nadr|2v|mv , VNW|pers|pron|stan|red|3|ev|fem , VNW|pers|pron|stan|red|3|ev|onz , VNW|pers|pron|stan|red|3|mv , VNW|pr|pron|obl|nadr|1|ev , VNW|pr|pron|obl|nadr|2v|getal , VNW|pr|pron|obl|nadr|2|getal , VNW|pr|pron|obl|red|1|ev , VNW|pr|pron|obl|red|2v|getal , VNW|pr|pron|obl|vol|1|ev , VNW|pr|pron|obl|vol|1|mv , VNW|pr|pron|obl|vol|2|getal , VNW|recip|pron|gen|vol|persoon|mv , VNW|recip|pron|obl|vol|persoon|mv , VNW|refl|pron|obl|nadr|3|getal , VNW|refl|pron|obl|red|3|getal , VNW|vb|adv-pron|obl|vol|3o|getal , VNW|vb|det|stan|nom|met-e|zonder-n , VNW|vb|det|stan|prenom|met-e|rest , VNW|vb|det|stan|prenom|zonder|evon , VNW|vb|pron|gen|vol|3m|ev , VNW|vb|pron|gen|vol|3p|mv , VNW|vb|pron|gen|vol|3v|ev , VNW|vb|pron|stan|vol|3o|ev , VNW|vb|pron|stan|vol|3p|getal , VZ|fin , VZ|init , VZ|versm , WW|inf|nom|zonder|zonder-n , WW|inf|prenom|met-e , WW|inf|vrij|zonder , WW|od|nom|met-e|mv-n , WW|od|nom|met-e|zonder-n , WW|od|prenom|met-e , WW|od|prenom|zonder , WW|od|vrij|zonder , WW|pv|conj|ev , WW|pv|tgw|ev , WW|pv|tgw|met-t , WW|pv|tgw|mv , WW|pv|verl|ev , WW|pv|verl|mv , WW|vd|nom|met-e|mv-n , WW|vd|nom|met-e|zonder-n , WW|vd|prenom|met-e , WW|vd|prenom|zonder , WW|vd|vrij|zonder , _SP |
parser |
ROOT , acl , acl:relcl , advcl , advmod , amod , appos , aux , aux:pass , case , cc , ccomp , compound:prt , conj , cop , csubj , dep , det , expl , expl:pv , fixed , flat , iobj , mark , nmod , nmod:poss , nsubj , nsubj:pass , nummod , obj , obl , obl:agent , orphan , parataxis , punct , xcomp |
ner |
CARDINAL , DATE , EVENT , FAC , GPE , LANGUAGE , LAW , LOC , MONEY , NORP , ORDINAL , ORG , PERCENT , PERSON , PRODUCT , QUANTITY , TIME , WORK_OF_ART |
準確率
類型 | 得分 |
---|---|
TAG_ACC |
94.99 |
SENTS_P |
85.43 |
SENTS_R |
88.31 |
SENTS_F |
86.84 |
DEP_UAS |
86.82 |
DEP_LAS |
82.13 |
ENTS_P |
76.69 |
ENTS_R |
73.93 |
ENTS_F |
75.28 |
TOKEN_ACC |
99.94 |
TOKEN_P |
99.74 |
TOKEN_R |
99.76 |
TOKEN_F |
99.75 |
POS_ACC |
96.39 |
MORPH_ACC |
96.06 |
MORPH_MICRO_P |
96.97 |
MORPH_MICRO_R |
95.06 |
MORPH_MICRO_F |
96.01 |
LEMMA_ACC |
95.42 |
📄 許可證
本項目採用 CC BY-SA 4.0
許可證。
Indonesian Roberta Base Posp Tagger
MIT
這是一個基於印尼語RoBERTa模型微調的詞性標註模型,在indonlu數據集上訓練,用於印尼語文本的詞性標註任務。
序列標註
Transformers 其他

I
w11wo
2.2M
7
Bert Base NER
MIT
基於BERT微調的命名實體識別模型,可識別四類實體:地點(LOC)、組織機構(ORG)、人名(PER)和雜項(MISC)
序列標註 英語
B
dslim
1.8M
592
Deid Roberta I2b2
MIT
該模型是基於RoBERTa微調的序列標註模型,用於識別和移除醫療記錄中的受保護健康信息(PHI/PII)。
序列標註
Transformers 支持多種語言

D
obi
1.1M
33
Ner English Fast
Flair自帶的英文快速4類命名實體識別模型,基於Flair嵌入和LSTM-CRF架構,在CoNLL-03數據集上達到92.92的F1分數。
序列標註
PyTorch 英語
N
flair
978.01k
24
French Camembert Postag Model
基於Camembert-base的法語詞性標註模型,使用free-french-treebank數據集訓練
序列標註
Transformers 法語

F
gilf
950.03k
9
Xlm Roberta Large Ner Spanish
基於XLM-Roberta-large架構微調的西班牙語命名實體識別模型,在CoNLL-2002數據集上表現優異。
序列標註
Transformers 西班牙語

X
MMG
767.35k
29
Nusabert Ner V1.3
MIT
基於NusaBert-v1.3在印尼語NER任務上微調的命名實體識別模型
序列標註
Transformers 其他

N
cahya
759.09k
3
Ner English Large
Flair框架內置的英文4類大型NER模型,基於文檔級XLM-R嵌入和FLERT技術,在CoNLL-03數據集上F1分數達94.36。
序列標註
PyTorch 英語
N
flair
749.04k
44
Punctuate All
MIT
基於xlm-roberta-base微調的多語言標點符號預測模型,支持12種歐洲語言的標點符號自動補全
序列標註
Transformers

P
kredor
728.70k
20
Xlm Roberta Ner Japanese
MIT
基於xlm-roberta-base微調的日語命名實體識別模型
序列標註
Transformers 支持多種語言

X
tsmatz
630.71k
25
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98