Nl Core News Sm
CPU最適化されたオランダ語処理パイプライン、トークン化、品詞タグ付け、依存関係解析、固有表現認識などのNLPタスクコンポーネントを含む
ダウンロード数 111
リリース時間 : 3/2/2022
モデル概要
spaCyが提供するオランダ語の小型言語モデルで、基本的なオランダ語テキスト処理タスク(トークン化、品詞タグ付け、依存関係解析、固有表現認識など)に適している
モデル特徴
CPU最適化
CPU使用シナリオ向けに特別に最適化されており、リソースが限られた環境に適している
包括的なNLPコンポーネント
トークン化から固有表現認識までの完全なNLP処理パイプラインを含む
高精度な品詞タグ付け
品詞タグ付けの精度は95.7%(UPOS)を達成
マルチタスクサポート
品詞タグ付け、依存関係解析、固有表現認識、レンマ化など、複数のNLPタスクを同時にサポート
モデル能力
トークン化
品詞タグ付け
形態素解析
レンマ化
依存構文解析
固有表現認識
文分割
使用事例
テキスト処理
オランダ語文書分析
オランダ語テキストに対して基本的な言語学的分析を実施
品詞、依存関係などの言語的特徴を識別可能
情報抽出
オランダ語固有表現認識
オランダ語テキストから固有表現を識別
NER F値は72.9%を達成
🚀 nl_core_news_sm
このモデルは、CPUで最適化されたオランダ語のパイプラインです。様々な自然言語処理タスクに対応しており、高精度な解析が可能です。
🚀 クイックスタート
詳細情報については、こちらをご覧ください。
✨ 主な機能
- CPUで最適化されたオランダ語パイプライン。
- 様々な自然言語処理タスク(NER、TAG、POSなど)に対応。
📚 ドキュメント
モデル情報
属性 | 詳情 |
---|---|
モデル名 | nl_core_news_sm |
バージョン | 3.7.0 |
spaCy | >=3.7.0,<3.8.0 |
デフォルトパイプライン | tok2vec , morphologizer , tagger , parser , lemmatizer , attribute_ruler , ner |
コンポーネント | tok2vec , morphologizer , tagger , parser , lemmatizer , senter , attribute_ruler , ner |
ベクトル | 0 キー、0 ユニークベクトル (0 次元) |
ソース | UD Dutch LassySmall v2.8 (Bouma, Gosse; van Noord, Gertjan) Dutch NER Annotations for UD LassySmall (NLP Town) UD Dutch Alpino v2.8 (Zeman, Daniel; Žabokrtský, Zdeněk; Bouma, Gosse; van Noord, Gertjan) |
ライセンス | CC BY-SA 4.0 |
作者 | Explosion |
ラベルスキーム
ラベルスキームを表示 (4つのコンポーネントに対する323のラベル)
コンポーネント | ラベル |
---|---|
morphologizer |
POS=PRON|Person=3|PronType=Dem , Number=Sing|POS=AUX|Tense=Pres|VerbForm=Fin , POS=ADV , POS=VERB|VerbForm=Part , POS=PUNCT , Number=Sing|POS=AUX|Tense=Past|VerbForm=Fin , POS=ADP , POS=NUM , Number=Plur|POS=NOUN , POS=VERB|VerbForm=Inf , POS=SCONJ , Definite=Def|POS=DET , Gender=Com|Number=Sing|POS=NOUN , Number=Sing|POS=VERB|Tense=Pres|VerbForm=Fin , Degree=Pos|POS=ADJ , Gender=Neut|Number=Sing|POS=PROPN , Gender=Com|Number=Sing|POS=PROPN , POS=AUX|VerbForm=Inf , Number=Sing|POS=VERB|Tense=Past|VerbForm=Fin , POS=DET , Gender=Neut|Number=Sing|POS=NOUN , POS=PRON|Person=3|PronType=Prs , POS=CCONJ , Number=Plur|POS=VERB|Tense=Pres|VerbForm=Fin , POS=PRON|Person=3|PronType=Ind , Degree=Cmp|POS=ADJ , Case=Nom|POS=PRON|Person=1|PronType=Prs , Definite=Ind|POS=DET , Case=Nom|POS=PRON|Person=3|PronType=Prs , POS=PRON|Person=3|Poss=Yes|PronType=Prs , Number=Plur|POS=AUX|Tense=Pres|VerbForm=Fin , POS=PRON|PronType=Rel , Case=Acc|POS=PRON|Person=1|PronType=Prs , Number=Plur|POS=VERB|Tense=Past|VerbForm=Fin , Gender=Com,Neut|Number=Sing|POS=NOUN , Case=Acc|POS=PRON|Person=3|PronType=Prs|Reflex=Yes , Case=Acc|POS=PRON|Person=3|PronType=Prs , POS=PROPN , POS=PRON|PronType=Ind , POS=PRON|Person=3|PronType=Int , Case=Acc|POS=PRON|PronType=Rcp , Number=Plur|POS=AUX|Tense=Past|VerbForm=Fin , Number=Sing|POS=NOUN , POS=PRON|Person=1|Poss=Yes|PronType=Prs , POS=SYM , Abbr=Yes|POS=X , Gender=Com,Neut|Number=Sing|POS=PROPN , Degree=Sup|POS=ADJ , POS=ADJ , Number=Sing|POS=PROPN , POS=PRON|PronType=Dem , POS=AUX|VerbForm=Part , POS=SPACE , POS=PRON|Person=3|PronType=Rel , Number=Plur|POS=PROPN , POS=PRON|Person=2|Poss=Yes|PronType=Prs , Case=Dat|POS=PRON|PronType=Dem , Case=Nom|POS=PRON|Person=2|PronType=Prs , POS=INTJ , Case=Acc|POS=PRON|Person=2|PronType=Prs , Case=Gen|POS=PRON|Person=3|Poss=Yes|PronType=Prs , POS=PRON|PronType=Int , POS=PRON|Person=2|PronType=Prs , POS=PRON|Person=3 , Case=Gen|POS=PRON|Person=2|PronType=Prs , POS=X |
tagger |
ADJ|nom|basis|met-e|mv-n , ADJ|nom|basis|met-e|zonder-n|bijz , ADJ|nom|basis|met-e|zonder-n|stan , ADJ|nom|basis|zonder|mv-n , ADJ|nom|basis|zonder|zonder-n , ADJ|nom|comp|met-e|mv-n , ADJ|nom|comp|met-e|zonder-n|stan , ADJ|nom|sup|met-e|mv-n , ADJ|nom|sup|met-e|zonder-n|bijz , ADJ|nom|sup|met-e|zonder-n|stan , ADJ|nom|sup|zonder|zonder-n , ADJ|postnom|basis|met-s , ADJ|postnom|basis|zonder , ADJ|postnom|comp|met-s , ADJ|prenom|basis|met-e|bijz , ADJ|prenom|basis|met-e|stan , ADJ|prenom|basis|zonder , ADJ|prenom|comp|met-e|stan , ADJ|prenom|comp|zonder , ADJ|prenom|sup|met-e|stan , ADJ|prenom|sup|zonder , ADJ|vrij|basis|zonder , ADJ|vrij|comp|zonder , ADJ|vrij|dim|zonder , ADJ|vrij|sup|zonder , BW , LET , LID|bep|dat|evmo , LID|bep|gen|evmo , LID|bep|gen|rest3 , LID|bep|stan|evon , LID|bep|stan|rest , LID|onbep|stan|agr , N|eigen|ev|basis|gen , N|eigen|ev|basis|genus|stan , N|eigen|ev|basis|onz|stan , N|eigen|ev|basis|zijd|stan , N|eigen|ev|dim|onz|stan , N|eigen|mv|basis , N|soort|ev|basis|dat , N|soort|ev|basis|gen , N|soort|ev|basis|genus|stan , N|soort|ev|basis|onz|stan , N|soort|ev|basis|zijd|stan , N|soort|ev|dim|onz|stan , N|soort|mv|basis , N|soort|mv|dim , SPEC|afgebr , SPEC|afk , SPEC|deeleigen , SPEC|enof , SPEC|meta , SPEC|symb , SPEC|vreemd , TSW , TW|hoofd|nom|mv-n|basis , TW|hoofd|nom|mv-n|dim , TW|hoofd|nom|zonder-n|basis , TW|hoofd|nom|zonder-n|dim , TW|hoofd|prenom|stan , TW|hoofd|vrij , TW|rang|nom|mv-n , TW|rang|nom|zonder-n , TW|rang|prenom|stan , VG|neven , VG|onder , VNW|aanw|adv-pron|obl|vol|3o|getal , VNW|aanw|adv-pron|stan|red|3|getal , VNW|aanw|det|dat|nom|met-e|zonder-n , VNW|aanw|det|dat|prenom|met-e|evmo , VNW|aanw|det|gen|prenom|met-e|rest3 , VNW|aanw|det|stan|nom|met-e|mv-n , VNW|aanw|det|stan|nom|met-e|zonder-n , VNW|aanw|det|stan|prenom|met-e|rest , VNW|aanw|det|stan|prenom|zonder|agr , VNW|aanw|det|stan|prenom|zonder|evon , VNW|aanw|det|stan|prenom|zonder|rest , VNW|aanw|det|stan|vrij|zonder , VNW|aanw|pron|gen|vol|3m|ev , VNW|aanw|pron|stan|vol|3o|ev , VNW|aanw|pron|stan|vol|3|getal , VNW|betr|det|stan|nom|met-e|zonder-n , VNW|betr|det|stan|nom|zonder|zonder-n , VNW|betr|pron|stan|vol|3|ev , VNW|betr|pron|stan|vol|persoon|getal , VNW|bez|det|gen|vol|3|ev|prenom|met-e|rest3 , VNW|bez|det|stan|nadr|2v|mv|prenom|zonder|agr , VNW|bez|det|stan|red|1|ev|prenom|zonder|agr , VNW|bez|det|stan|red|2v|ev|prenom|zonder|agr , VNW|bez|det|stan|red|3|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|1|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|1|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|1|mv|prenom|met-e|rest , VNW|bez|det|stan|vol|1|mv|prenom|zonder|evon , VNW|bez|det|stan|vol|2v|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|2|getal|prenom|zonder|agr , VNW|bez|det|stan|vol|3m|ev|nom|met-e|zonder-n , VNW|bez|det|stan|vol|3m|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|3p|mv|prenom|met-e|rest , VNW|bez|det|stan|vol|3v|ev|nom|met-e|zonder-n , VNW|bez|det|stan|vol|3v|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|3|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|3|mv|prenom|zonder|agr , VNW|excl|pron|stan|vol|3|getal , VNW|onbep|adv-pron|gen|red|3|getal , VNW|onbep|adv-pron|obl|vol|3o|getal , VNW|onbep|det|stan|nom|met-e|mv-n , VNW|onbep|det|stan|nom|met-e|zonder-n , VNW|onbep|det|stan|nom|zonder|zonder-n , VNW|onbep|det|stan|prenom|met-e|agr , VNW|onbep|det|stan|prenom|met-e|evz , VNW|onbep|det|stan|prenom|met-e|mv , VNW|onbep|det|stan|prenom|met-e|rest , VNW|onbep|det|stan|prenom|zonder|agr , VNW|onbep|det|stan|prenom|zonder|evon , VNW|onbep|det|stan|vrij|zonder , VNW|onbep|grad|gen|nom|met-e|mv-n|basis , VNW|onbep|grad|stan|nom|met-e|mv-n|basis , VNW|onbep|grad|stan|nom|met-e|mv-n|sup , VNW|onbep|grad|stan|nom|met-e|zonder-n|basis , VNW|onbep|grad|stan|nom|met-e|zonder-n|sup , VNW|onbep|grad|stan|prenom|met-e|agr|basis , VNW|onbep|grad|stan|prenom|met-e|agr|comp , VNW|onbep|grad|stan|prenom|met-e|agr|sup , VNW|onbep|grad|stan|prenom|met-e|mv|basis , VNW|onbep|grad|stan|prenom|zonder|agr|basis , VNW|onbep|grad|stan|prenom|zonder|agr|comp , VNW|onbep|grad|stan|vrij|zonder|basis , VNW|onbep|grad|stan|vrij|zonder|comp , VNW|onbep|grad|stan|vrij|zonder|sup , VNW|onbep|pron|gen|vol|3p|ev , VNW|onbep|pron|stan|vol|3o|ev , VNW|onbep|pron|stan|vol|3p|ev , VNW|pers|pron|gen|vol|2|getal , VNW|pers|pron|nomin|nadr|3m|ev|masc , VNW|pers|pron|nomin|nadr|3v|ev|fem , VNW|pers|pron|nomin|red|1|mv , VNW|pers|pron|nomin|red|2v|ev , VNW|pers|pron|nomin|red|2|getal , VNW|pers|pron|nomin|red|3p|ev|masc , VNW|pers|pron|nomin|red|3|ev|masc , VNW|pers|pron|nomin|vol|1|ev , VNW|pers|pron|nomin|vol|1|mv , VNW|pers|pron|nomin|vol|2b|getal , VNW|pers|pron|nomin|vol|2v|ev , VNW|pers|pron|nomin|vol|2|getal , VNW|pers|pron|nomin|vol|3p|mv , VNW|pers|pron|nomin|vol|3v|ev|fem , VNW|pers|pron|nomin|vol|3|ev|masc , VNW|pers|pron|obl|nadr|3m|ev|masc , VNW|pers|pron|obl|red|3|ev|masc , VNW|pers|pron|obl|vol|2v|ev , VNW|pers|pron|obl|vol|3p|mv , VNW|pers|pron|obl|vol|3|ev|masc , VNW|pers|pron|obl|vol|3|getal|fem , VNW|pers|pron|stan|nadr|2v|mv , VNW|pers|pron|stan|red|3|ev|fem , VNW|pers|pron|stan|red|3|ev|onz , VNW|pers|pron|stan|red|3|mv , VNW|pr|pron|obl|nadr|1|ev , VNW|pr|pron|obl|nadr|2v|getal , VNW|pr|pron|obl|nadr|2|getal , VNW|pr|pron|obl|red|1|ev , VNW|pr|pron|obl|red|2v|getal , VNW|pr|pron|obl|vol|1|ev , VNW|pr|pron|obl|vol|1|mv , VNW|pr|pron|obl|vol|2|getal , VNW|recip|pron|gen|vol|persoon|mv , VNW|recip|pron|obl|vol|persoon|mv , VNW|refl|pron|obl|nadr|3|getal , VNW|refl|pron|obl|red|3|getal , VNW|vb|adv-pron|obl|vol|3o|getal , VNW|vb|det|stan|nom|met-e|zonder-n , VNW|vb|det|stan|prenom|met-e|rest , VNW|vb|det|stan|prenom|zonder|evon , VNW|vb|pron|gen|vol|3m|ev , VNW|vb|pron|gen|vol|3p|mv , VNW|vb|pron|gen|vol|3v|ev , VNW|vb|pron|stan|vol|3o|ev , VNW|vb|pron|stan|vol|3p|getal , VZ|fin , VZ|init , VZ|versm , WW|inf|nom|zonder|zonder-n , WW|inf|prenom|met-e , WW|inf|vrij|zonder , WW|od|nom|met-e|mv-n , WW|od|nom|met-e|zonder-n , WW|od|prenom|met-e , WW|od|prenom|zonder , WW|od|vrij|zonder , WW|pv|conj|ev , WW|pv|tgw|ev , WW|pv|tgw|met-t , WW|pv|tgw|mv , WW|pv|verl|ev , WW|pv|verl|mv , WW|vd|nom|met-e|mv-n , WW|vd|nom|met-e|zonder-n , WW|vd|prenom|met-e , WW|vd|prenom|zonder , WW|vd|vrij|zonder , _SP |
parser |
ROOT , acl , acl:relcl , advcl , advmod , amod , appos , aux , aux:pass , case , cc , ccomp , compound:prt , conj , cop , csubj , dep , det , expl , expl:pv , fixed , flat , iobj , mark , nmod , nmod:poss , nsubj , nsubj:pass , nummod , obj , obl , obl:agent , orphan , parataxis , punct , xcomp |
ner |
CARDINAL , DATE , EVENT , FAC , GPE , LANGUAGE , LAW , LOC , MONEY , NORP , ORDINAL , ORG , PERCENT , PERSON , PRODUCT , QUANTITY , TIME , WORK_OF_ART |
精度
タイプ | スコア |
---|---|
TAG_ACC |
93.92 |
SENTS_P |
85.00 |
SENTS_R |
88.24 |
SENTS_F |
86.59 |
DEP_UAS |
85.35 |
DEP_LAS |
80.15 |
ENTS_P |
74.96 |
ENTS_R |
71.02 |
ENTS_F |
72.94 |
TOKEN_ACC |
99.94 |
TOKEN_P |
99.74 |
TOKEN_R |
99.76 |
TOKEN_F |
99.75 |
POS_ACC |
95.73 |
MORPH_ACC |
95.05 |
MORPH_MICRO_P |
95.82 |
MORPH_MICRO_R |
93.63 |
MORPH_MICRO_F |
94.71 |
LEMMA_ACC |
95.04 |
📄 ライセンス
このモデルは CC BY-SA 4.0
ライセンスの下で提供されています。
Indonesian Roberta Base Posp Tagger
MIT
これはインドネシア語RoBERTaモデルをファインチューニングした品詞タグ付けモデルで、indonluデータセットで訓練され、インドネシア語テキストの品詞タグ付けタスクに使用されます。
シーケンスラベリング
Transformers その他

I
w11wo
2.2M
7
Bert Base NER
MIT
BERTを微調整した命名エンティティ識別モデルで、4種類のエンティティ(場所(LOC)、組織(ORG)、人名(PER)、その他(MISC))を識別できます。
シーケンスラベリング 英語
B
dslim
1.8M
592
Deid Roberta I2b2
MIT
このモデルはRoBERTaをファインチューニングしたシーケンスラベリングモデルで、医療記録内の保護対象健康情報(PHI/PII)を識別・除去します。
シーケンスラベリング
Transformers 複数言語対応

D
obi
1.1M
33
Ner English Fast
Flairに組み込まれた英語の高速4クラス固有表現認識モデルで、Flair埋め込みとLSTM-CRFアーキテクチャを使用し、CoNLL-03データセットで92.92のF1スコアを達成しています。
シーケンスラベリング
PyTorch 英語
N
flair
978.01k
24
French Camembert Postag Model
Camembert-baseをベースとしたフランス語の品詞タグ付けモデルで、free-french-treebankデータセットを使用して学習されました。
シーケンスラベリング
Transformers フランス語

F
gilf
950.03k
9
Xlm Roberta Large Ner Spanish
XLM - Roberta - largeアーキテクチャに基づいて微調整されたスペイン語の命名エンティティ認識モデルで、CoNLL - 2002データセットで優れた性能を発揮します。
シーケンスラベリング
Transformers スペイン語

X
MMG
767.35k
29
Nusabert Ner V1.3
MIT
NusaBert-v1.3を基にインドネシア語NERタスクでファインチューニングした固有表現認識モデル
シーケンスラベリング
Transformers その他

N
cahya
759.09k
3
Ner English Large
Flairフレームワークに組み込まれた英語の4種類の大型NERモデルで、文書レベルのXLM - R埋め込みとFLERT技術に基づいており、CoNLL - 03データセットでF1スコアが94.36に達します。
シーケンスラベリング
PyTorch 英語
N
flair
749.04k
44
Punctuate All
MIT
xlm - roberta - baseを微調整した多言語句読点予測モデルで、12種類の欧州言語の句読点自動補完に対応しています。
シーケンスラベリング
Transformers

P
kredor
728.70k
20
Xlm Roberta Ner Japanese
MIT
xlm-roberta-baseをファインチューニングした日本語固有表現認識モデル
シーケンスラベリング
Transformers 複数言語対応

X
tsmatz
630.71k
25
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98