Nl Core News Lg
CPU向けに最適化されたオランダ語処理フローで、様々な自然言語処理コンポーネントを含んでいます。
ダウンロード数 58
リリース時間 : 3/2/2022
モデル概要
これはオランダ語用の自然言語処理モデルで、品詞タグ付け、命名エンティティ認識、依存構文解析などの様々な機能を備えています。
モデル特徴
マルチタスク処理
品詞タグ付け、命名エンティティ認識、依存構文解析などの様々な自然言語処理タスクを同時にサポートします。
CPU最適化
CPU使用に特化して最適化されています。
高品質の単語ベクトル
500,000個の一意のベクトル(300次元)を含んでいます。
全面的なカバレッジ
オランダ語の様々な文法特徴と形態変化をサポートします。
モデル能力
品詞タグ付け
命名エンティティ認識
形態解析
語形還元
依存構文解析
文分割
使用事例
テキスト分析
オランダ語ドキュメント処理
オランダ語ドキュメントの品詞、エンティティ、文法構造を自動分析します。
精度は95%以上
情報抽出
オランダ語テキストから人名、地名、組織名などのエンティティ情報を抽出します。
F1値76.73%
言語学習
オランダ語文法解析
学習者がオランダ語の文構造と品詞変化を理解するのを支援します。
🚀 nl_core_news_lg
nl_core_news_lg
は、CPU向けに最適化されたオランダ語処理パイプラインです。このモデルは、様々な自然言語処理タスク、例えば命名エンティティ認識や品詞タグ付け、形態解析などを行うことができ、高い精度を誇ります。
🚀 クイックスタート
詳細については、こちらを参照してください。
✨ 主な機能
- 命名エンティティ認識:文章内の特定のエンティティ(人名、組織名、場所など)を識別します。
- 品詞タグ付け:各単語に適切な品詞タグを付与します。
- 形態解析:単語の形態的な特徴を分析します。
- 詞形還元:単語を基本形に変換します。
- 依存関係解析:単語間の文法的な依存関係を特定します。
- 文分割:文章を文単位に分割します。
📦 インストール
このREADMEには具体的なインストール手順が記載されていないため、このセクションは省略されます。
💻 使用例
このREADMEには具体的なコード例が記載されていないため、このセクションは省略されます。
📚 ドキュメント
モデル概要
特性 | 詳細 |
---|---|
名称 | nl_core_news_lg |
バージョン | 3.7.0 |
spaCy | >=3.7.0,<3.8.0 |
デフォルトパイプライン | tok2vec , morphologizer , tagger , parser , lemmatizer , attribute_ruler , ner |
コンポーネント | tok2vec , morphologizer , tagger , parser , lemmatizer , senter , attribute_ruler , ner |
ベクトル | 500000個のキー、500000個の一意のベクトル(300次元) |
ソース | UDオランダ語LassySmall v2.8 (Bouma, Gosse; van Noord, Gertjan) オランダ語命名エンティティ認識アノテーションUD LassySmall (NLP Town) UDオランダ語Alpino v2.8 (Zeman, Daniel; Žabokrtský, Zdeněk; Bouma, Gosse; van Noord, Gertjan) Explosion fastTextベクトル (cbow, OSCAR Common Crawl + Wikipedia) (Explosion) |
ライセンス | CC BY - SA 4.0 |
作者 | Explosion |
タグスキーム
タグスキームを表示(4つのコンポーネントの323個のタグ)
コンポーネント | タグ |
---|---|
morphologizer |
POS=PRON|Person=3|PronType=Dem , Number=Sing|POS=AUX|Tense=Pres|VerbForm=Fin , POS=ADV , POS=VERB|VerbForm=Part , POS=PUNCT , Number=Sing|POS=AUX|Tense=Past|VerbForm=Fin , POS=ADP , POS=NUM , Number=Plur|POS=NOUN , POS=VERB|VerbForm=Inf , POS=SCONJ , Definite=Def|POS=DET , Gender=Com|Number=Sing|POS=NOUN , Number=Sing|POS=VERB|Tense=Pres|VerbForm=Fin , Degree=Pos|POS=ADJ , Gender=Neut|Number=Sing|POS=PROPN , Gender=Com|Number=Sing|POS=PROPN , POS=AUX|VerbForm=Inf , Number=Sing|POS=VERB|Tense=Past|VerbForm=Fin , POS=DET , Gender=Neut|Number=Sing|POS=NOUN , POS=PRON|Person=3|PronType=Prs , POS=CCONJ , Number=Plur|POS=VERB|Tense=Pres|VerbForm=Fin , POS=PRON|Person=3|PronType=Ind , Degree=Cmp|POS=ADJ , Case=Nom|POS=PRON|Person=1|PronType=Prs , Definite=Ind|POS=DET , Case=Nom|POS=PRON|Person=3|PronType=Prs , POS=PRON|Person=3|Poss=Yes|PronType=Prs , Number=Plur|POS=AUX|Tense=Pres|VerbForm=Fin , POS=PRON|PronType=Rel , Case=Acc|POS=PRON|Person=1|PronType=Prs , Number=Plur|POS=VERB|Tense=Past|VerbForm=Fin , Gender=Com,Neut|Number=Sing|POS=NOUN , Case=Acc|POS=PRON|Person=3|PronType=Prs|Reflex=Yes , Case=Acc|POS=PRON|Person=3|PronType=Prs , POS=PROPN , POS=PRON|PronType=Ind , POS=PRON|Person=3|PronType=Int , Case=Acc|POS=PRON|PronType=Rcp , Number=Plur|POS=AUX|Tense=Past|VerbForm=Fin , Number=Sing|POS=NOUN , POS=PRON|Person=1|Poss=Yes|PronType=Prs , POS=SYM , Abbr=Yes|POS=X , Gender=Com,Neut|Number=Sing|POS=PROPN , Degree=Sup|POS=ADJ , POS=ADJ , Number=Sing|POS=PROPN , POS=PRON|PronType=Dem , POS=AUX|VerbForm=Part , POS=SPACE , POS=PRON|Person=3|PronType=Rel , Number=Plur|POS=PROPN , POS=PRON|Person=2|Poss=Yes|PronType=Prs , Case=Dat|POS=PRON|PronType=Dem , Case=Nom|POS=PRON|Person=2|PronType=Prs , POS=INTJ , Case=Acc|POS=PRON|Person=2|PronType=Prs , Case=Gen|POS=PRON|Person=3|Poss=Yes|PronType=Prs , POS=PRON|PronType=Int , POS=PRON|Person=2|PronType=Prs , POS=PRON|Person=3 , Case=Gen|POS=PRON|Person=2|PronType=Prs , POS=X |
tagger |
ADJ|nom|basis|met-e|mv-n , ADJ|nom|basis|met-e|zonder-n|bijz , ADJ|nom|basis|met-e|zonder-n|stan , ADJ|nom|basis|zonder|mv-n , ADJ|nom|basis|zonder|zonder-n , ADJ|nom|comp|met-e|mv-n , ADJ|nom|comp|met-e|zonder-n|stan , ADJ|nom|sup|met-e|mv-n , ADJ|nom|sup|met-e|zonder-n|bijz , ADJ|nom|sup|met-e|zonder-n|stan , ADJ|nom|sup|zonder|zonder-n , ADJ|postnom|basis|met-s , ADJ|postnom|basis|zonder , ADJ|postnom|comp|met-s , ADJ|prenom|basis|met-e|bijz , ADJ|prenom|basis|met-e|stan , ADJ|prenom|basis|zonder , ADJ|prenom|comp|met-e|stan , ADJ|prenom|comp|zonder , ADJ|prenom|sup|met-e|stan , ADJ|prenom|sup|zonder , ADJ|vrij|basis|zonder , ADJ|vrij|comp|zonder , ADJ|vrij|dim|zonder , ADJ|vrij|sup|zonder , BW , LET , LID|bep|dat|evmo , LID|bep|gen|evmo , LID|bep|gen|rest3 , LID|bep|stan|evon , LID|bep|stan|rest , LID|onbep|stan|agr , N|eigen|ev|basis|gen , N|eigen|ev|basis|genus|stan , N|eigen|ev|basis|onz|stan , N|eigen|ev|basis|zijd|stan , N|eigen|ev|dim|onz|stan , N|eigen|mv|basis , N|soort|ev|basis|dat , N|soort|ev|basis|gen , N|soort|ev|basis|genus|stan , N|soort|ev|basis|onz|stan , N|soort|ev|basis|zijd|stan , N|soort|ev|dim|onz|stan , N|soort|mv|basis , N|soort|mv|dim , SPEC|afgebr , SPEC|afk , SPEC|deeleigen , SPEC|enof , SPEC|meta , SPEC|symb , SPEC|vreemd , TSW , TW|hoofd|nom|mv-n|basis , TW|hoofd|nom|mv-n|dim , TW|hoofd|nom|zonder-n|basis , TW|hoofd|nom|zonder-n|dim , TW|hoofd|prenom|stan , TW|hoofd|vrij , TW|rang|nom|mv-n , TW|rang|nom|zonder-n , TW|rang|prenom|stan , VG|neven , VG|onder , VNW|aanw|adv-pron|obl|vol|3o|getal , VNW|aanw|adv-pron|stan|red|3|getal , VNW|aanw|det|dat|nom|met-e|zonder-n , VNW|aanw|det|dat|prenom|met-e|evmo , VNW|aanw|det|gen|prenom|met-e|rest3 , VNW|aanw|det|stan|nom|met-e|mv-n , VNW|aanw|det|stan|nom|met-e|zonder-n , VNW|aanw|det|stan|prenom|met-e|rest , VNW|aanw|det|stan|prenom|zonder|agr , VNW|aanw|det|stan|prenom|zonder|evon , VNW|aanw|det|stan|prenom|zonder|rest , VNW|aanw|det|stan|vrij|zonder , VNW|aanw|pron|gen|vol|3m|ev , VNW|aanw|pron|stan|vol|3o|ev , VNW|aanw|pron|stan|vol|3|getal , VNW|betr|det|stan|nom|met-e|zonder-n , VNW|betr|det|stan|nom|zonder|zonder-n , VNW|betr|pron|stan|vol|3|ev , VNW|betr|pron|stan|vol|persoon|getal , VNW|bez|det|gen|vol|3|ev|prenom|met-e|rest3 , VNW|bez|det|stan|nadr|2v|mv|prenom|zonder|agr , VNW|bez|det|stan|red|1|ev|prenom|zonder|agr , VNW|bez|det|stan|red|2v|ev|prenom|zonder|agr , VNW|bez|det|stan|red|3|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|1|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|1|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|1|mv|prenom|met-e|rest , VNW|bez|det|stan|vol|1|mv|prenom|zonder|evon , VNW|bez|det|stan|vol|2v|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|2|getal|prenom|zonder|agr , VNW|bez|det|stan|vol|3m|ev|nom|met-e|zonder-n , VNW|bez|det|stan|vol|3m|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|3p|mv|prenom|met-e|rest , VNW|bez|det|stan|vol|3v|ev|nom|met-e|zonder-n , VNW|bez|det|stan|vol|3v|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|3|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|3|mv|prenom|zonder|agr , VNW|excl|pron|stan|vol|3|getal , VNW|onbep|adv-pron|gen|red|3|getal , VNW|onbep|adv-pron|obl|vol|3o|getal , VNW|onbep|det|stan|nom|met-e|mv-n , VNW|onbep|det|stan|nom|met-e|zonder-n , VNW|onbep|det|stan|nom|zonder|zonder-n , VNW|onbep|det|stan|prenom|met-e|agr , VNW|onbep|det|stan|prenom|met-e|evz , VNW|onbep|det|stan|prenom|met-e|mv , VNW|onbep|det|stan|prenom|met-e|rest , VNW|onbep|det|stan|prenom|zonder|agr , VNW|onbep|det|stan|prenom|zonder|evon , VNW|onbep|det|stan|vrij|zonder , VNW|onbep|grad|gen|nom|met-e|mv-n|basis , VNW|onbep|grad|stan|nom|met-e|mv-n|basis , VNW|onbep|grad|stan|nom|met-e|mv-n|sup , VNW|onbep|grad|stan|nom|met-e|zonder-n|basis , VNW|onbep|grad|stan|nom|met-e|zonder-n|sup , VNW|onbep|grad|stan|prenom|met-e|agr|basis , VNW|onbep|grad|stan|prenom|met-e|agr|comp , VNW|onbep|grad|stan|prenom|met-e|agr|sup , VNW|onbep|grad|stan|prenom|met-e|mv|basis , VNW|onbep|grad|stan|prenom|zonder|agr|basis , VNW|onbep|grad|stan|prenom|zonder|agr|comp , VNW|onbep|grad|stan|vrij|zonder|basis , VNW|onbep|grad|stan|vrij|zonder|comp , VNW|onbep|grad|stan|vrij|zonder|sup , VNW|onbep|pron|gen|vol|3p|ev , VNW|onbep|pron|stan|vol|3o|ev , VNW|onbep|pron|stan|vol|3p|ev , VNW|pers|pron|gen|vol|2|getal , VNW|pers|pron|nomin|nadr|3m|ev|masc , VNW|pers|pron|nomin|nadr|3v|ev|fem , VNW|pers|pron|nomin|red|1|mv , VNW|pers|pron|nomin|red|2v|ev , VNW|pers|pron|nomin|red|2|getal , VNW|pers|pron|nomin|red|3p|ev|masc , VNW|pers|pron|nomin|red|3|ev|masc , VNW|pers|pron|nomin|vol|1|ev , VNW|pers|pron|nomin|vol|1|mv , VNW|pers|pron|nomin|vol|2b|getal , VNW|pers|pron|nomin|vol|2v|ev , VNW|pers|pron|nomin|vol|2|getal , VNW|pers|pron|nomin|vol|3p|mv , VNW|pers|pron|nomin|vol|3v|ev|fem , VNW|pers|pron|nomin|vol|3|ev|masc , VNW|pers|pron|obl|nadr|3m|ev|masc , VNW|pers|pron|obl|red|3|ev|masc , VNW|pers|pron|obl|vol|2v|ev , VNW|pers|pron|obl|vol|3p|mv , VNW|pers|pron|obl|vol|3|ev|masc , VNW|pers|pron|obl|vol|3|getal|fem , VNW|pers|pron|stan|nadr|2v|mv , VNW|pers|pron|stan|red|3|ev|fem , VNW|pers|pron|stan|red|3|ev|onz , VNW|pers|pron|stan|red|3|mv , VNW|pr|pron|obl|nadr|1|ev , VNW|pr|pron|obl|nadr|2v|getal , VNW|pr|pron|obl|nadr|2|getal , VNW|pr|pron|obl|red|1|ev , VNW|pr|pron|obl|red|2v|getal , VNW|pr|pron|obl|vol|1|ev , VNW|pr|pron|obl|vol|1|mv , VNW|pr|pron|obl|vol|2|getal , VNW|recip|pron|gen|vol|persoon|mv , VNW|recip|pron|obl|vol|persoon|mv , VNW|refl|pron|obl|nadr|3|getal , VNW|refl|pron|obl|red|3|getal , VNW|vb|adv-pron|obl|vol|3o|getal , VNW|vb|det|stan|nom|met-e|zonder-n , VNW|vb|det|stan|prenom|met-e|rest , VNW|vb|det|stan|prenom|zonder|evon , VNW|vb|pron|gen|vol|3m|ev , VNW|vb|pron|gen|vol|3p|mv , VNW|vb|pron|gen|vol|3v|ev , VNW|vb|pron|stan|vol|3o|ev , VNW|vb|pron|stan|vol|3p|getal , VZ|fin , VZ|init , VZ|versm , WW|inf|nom|zonder|zonder-n , WW|inf|prenom|met-e , WW|inf|vrij|zonder , WW|od|nom|met-e|mv-n , WW|od|nom|met-e|zonder-n , WW|od|prenom|met-e , WW|od|prenom|zonder , WW|od|vrij|zonder , WW|pv|conj|ev , WW|pv|tgw|ev , WW|pv|tgw|met-t , WW|pv|tgw|mv , WW|pv|verl|ev , WW|pv|verl|mv , WW|vd|nom|met-e|mv-n , WW|vd|nom|met-e|zonder-n , WW|vd|prenom|met-e , WW|vd|prenom|zonder , WW|vd|vrij|zonder , _SP |
parser |
ROOT , acl , acl:relcl , advcl , advmod , amod , appos , aux , aux:pass , case , cc , ccomp , compound:prt , conj , cop , csubj , dep , det , expl , expl:pv , fixed , flat , iobj , mark , nmod , nmod:poss , nsubj , nsubj:pass , nummod , obj , obl , obl:agent , orphan , parataxis , punct , xcomp |
ner |
CARDINAL , DATE , EVENT , FAC , GPE , LANGUAGE , LAW , LOC , MONEY , NORP , ORDINAL , ORG , PERCENT , PERSON , PRODUCT , QUANTITY , TIME , WORK_OF_ART |
精度
タイプ | スコア |
---|---|
TAG_ACC |
95.14 |
SENTS_P |
85.80 |
SENTS_R |
88.88 |
SENTS_F |
87.32 |
DEP_UAS |
87.02 |
DEP_LAS |
82.53 |
ENTS_P |
78.51 |
ENTS_R |
75.03 |
ENTS_F |
76.73 |
TOKEN_ACC |
99.94 |
TOKEN_P |
99.74 |
TOKEN_R |
99.76 |
TOKEN_F |
99.75 |
POS_ACC |
96.39 |
MORPH_ACC |
96.29 |
MORPH_MICRO_P |
97.12 |
MORPH_MICRO_R |
95.47 |
MORPH_MICRO_F |
96.29 |
LEMMA_ACC |
95.56 |
🔧 技術詳細
このREADMEには具体的な技術的な説明が50文字以上記載されていないため、このセクションは省略されます。
📄 ライセンス
このモデルはCC BY - SA 4.0
ライセンスの下で提供されています。
Indonesian Roberta Base Posp Tagger
MIT
これはインドネシア語RoBERTaモデルをファインチューニングした品詞タグ付けモデルで、indonluデータセットで訓練され、インドネシア語テキストの品詞タグ付けタスクに使用されます。
シーケンスラベリング
Transformers その他

I
w11wo
2.2M
7
Bert Base NER
MIT
BERTを微調整した命名エンティティ識別モデルで、4種類のエンティティ(場所(LOC)、組織(ORG)、人名(PER)、その他(MISC))を識別できます。
シーケンスラベリング 英語
B
dslim
1.8M
592
Deid Roberta I2b2
MIT
このモデルはRoBERTaをファインチューニングしたシーケンスラベリングモデルで、医療記録内の保護対象健康情報(PHI/PII)を識別・除去します。
シーケンスラベリング
Transformers 複数言語対応

D
obi
1.1M
33
Ner English Fast
Flairに組み込まれた英語の高速4クラス固有表現認識モデルで、Flair埋め込みとLSTM-CRFアーキテクチャを使用し、CoNLL-03データセットで92.92のF1スコアを達成しています。
シーケンスラベリング
PyTorch 英語
N
flair
978.01k
24
French Camembert Postag Model
Camembert-baseをベースとしたフランス語の品詞タグ付けモデルで、free-french-treebankデータセットを使用して学習されました。
シーケンスラベリング
Transformers フランス語

F
gilf
950.03k
9
Xlm Roberta Large Ner Spanish
XLM - Roberta - largeアーキテクチャに基づいて微調整されたスペイン語の命名エンティティ認識モデルで、CoNLL - 2002データセットで優れた性能を発揮します。
シーケンスラベリング
Transformers スペイン語

X
MMG
767.35k
29
Nusabert Ner V1.3
MIT
NusaBert-v1.3を基にインドネシア語NERタスクでファインチューニングした固有表現認識モデル
シーケンスラベリング
Transformers その他

N
cahya
759.09k
3
Ner English Large
Flairフレームワークに組み込まれた英語の4種類の大型NERモデルで、文書レベルのXLM - R埋め込みとFLERT技術に基づいており、CoNLL - 03データセットでF1スコアが94.36に達します。
シーケンスラベリング
PyTorch 英語
N
flair
749.04k
44
Punctuate All
MIT
xlm - roberta - baseを微調整した多言語句読点予測モデルで、12種類の欧州言語の句読点自動補完に対応しています。
シーケンスラベリング
Transformers

P
kredor
728.70k
20
Xlm Roberta Ner Japanese
MIT
xlm-roberta-baseをファインチューニングした日本語固有表現認識モデル
シーケンスラベリング
Transformers 複数言語対応

X
tsmatz
630.71k
25
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98