pt_core_news_smオープンソースポルトガル語処理モデル - タグ付け、品詞、エンティティなどの分析を無料で実現

ホーム

Pt Core News Sm

spacyによって開発

spaCyが提供するCPU向けに最適化されたポルトガル語処理フローで、トークン化、品詞タグ付け、依存解析、固有表現認識などの機能が含まれています。

シーケンスラベリングその他#ポルトガル語NLP #マルチタスク処理 #依存構文解析

ダウンロード数 87

リリース時間 : 3/2/2022

モデル概要

これはポルトガル語の自然言語処理モデルで、主にテキストのタグ付け分類タスク、品詞タグ付け、固有表現認識、依存解析などに使用されます。

モデル特徴

CPU最適化

CPU使用シナリオに特化して最適化された処理フロー

包括的なNLP機能

トークン化から固有表現認識までの完全なNLP処理能力を提供

高精度の語形還元

語形還元の正解率が96.76%に達する

マルチタスク対応

品詞タグ付け、依存解析、固有表現認識などの複数のタスクを同時にサポート

モデル能力

固有表現認識

品詞タグ付け

形態解析

語形還元

依存解析

文分割

使用事例

テキスト処理

ポルトガル語ドキュメント分析

ポルトガル語ドキュメントに対して品詞タグ付けと固有表現認識を行う

NER F1スコア0.88、POS正解率0.96

ポルトガル語構文解析

ポルトガル語の文の依存関係を分析する

LASスコア0.84、UASスコア0.89

情報抽出

ポルトガル語のエンティティ認識

ポルトガル語テキストから人名、地名などのエンティティを抽出する

NER精度0.88、再現率0.88

🚀 pt_core_news_sm

このモデルは、CPUに最適化されたポルトガル語処理パイプラインで、様々な自然言語処理タスクを行うことができます。

🚀 クイックスタート

このモデルは、ポルトガル語の自然言語処理タスクを行うために最適化されています。詳細な使い方やモデルの指標については、以下のセクションを参照してください。

✨ 主な機能

命名エンティティ認識（NER）
品詞タグ付け（TAG、POS）
形態素解析（MORPH）
語形還元（LEMMA）
依存関係解析（UNLABELED_DEPENDENCIES、LABELED_DEPENDENCIES）
文分割（SENTS）

📚 ドキュメント

モデル指標

タスク	指標名	指標タイプ	値
命名エンティティ認識（NER）	NER 精度	精度	0.8794147723
命名エンティティ認識（NER）	NER 再現率	再現率	0.8800897408
命名エンティティ認識（NER）	NER F1スコア	F1スコア	0.8797521271
品詞タグ付け（TAG）	TAG（XPOS）精度	精度	0.8880083214
品詞タグ付け（POS）	POS（UPOS）精度	精度	0.9624052702
形態素解析（MORPH）	形態（UFeats）精度	精度	0.947102526
語形還元（LEMMA）	語形還元精度	精度	0.9675598039
無標識依存関係（UNLABELED_DEPENDENCIES）	無標識依存スコア（UAS）	F1スコア	0.8891065154
有標識依存関係（LABELED_DEPENDENCIES）	有標識依存スコア（LAS）	F1スコア	0.8444034795
文分割（SENTS）	文F1スコア	F1スコア	0.9277043528

モデル詳細

属性	詳細
モデル名	`pt_core_news_sm`
バージョン	`3.7.0`
spaCy	`>=3.7.0,<3.8.0`
デフォルトパイプライン	`tok2vec`, `morphologizer`, `parser`, `lemmatizer`, `attribute_ruler`, `ner`
コンポーネント	`tok2vec`, `morphologizer`, `parser`, `lemmatizer`, `senter`, `attribute_ruler`, `ner`
ベクトル	0個のキー、0個の一意のベクトル（0次元）
ソース	UDポルトガル語Bosque v2.8 (Rademaker, Alexandre; Freitas, Cláudia; de Souza, Elvis; Silveira, Aline; Cavalcanti, Tatiana; Evelyn, Wograine; Rocha, Luisa; Soares-Bastos, Isabela; Bick, Eckhard; Chalub, Fabricio; Paulino-Passos, Guilherme; Real, Livy; de Paiva, Valeria; Zeman, Daniel; Popel, Martin; Mareček, David; Silveira, Natalia; Martins, André) WikiNER (Joel Nothman, Nicky Ringland, Will Radford, Tara Murphy, James R Curran)
ライセンス	`CC BY-SA 4.0`
作者	Explosion

タグスキーム

タグスキームを表示（3つのコンポーネントの590個のタグ）

| コンポーネント | タグ | | ---- | ---- | | **`morphologizer`** | `Definite=Ind\|Gender=Masc\|Number=Sing\|POS=DET\|PronType=Art`, `Gender=Masc\|Number=Sing\|POS=NOUN`, `Gender=Masc\|Number=Sing\|POS=ADJ`, `Definite=Def\|Gender=Masc\|Number=Sing\|POS=DET\|PronType=Art`, `Gender=Masc\|Number=Sing\|POS=PROPN`, `Number=Sing\|POS=PROPN`, `Mood=Ind\|Number=Sing\|POS=AUX\|Person=3\|Tense=Pres\|VerbForm=Fin`, `Gender=Masc\|Number=Plur\|POS=NOUN`, `Definite=Def\|POS=ADP\|PronType=Art`, `Gender=Fem\|Number=Sing\|POS=NOUN`, `Gender=Fem\|Number=Sing\|POS=ADJ`, `POS=PUNCT`, `NumType=Card\|POS=NUM`, `POS=ADV`, `Gender=Fem\|Number=Plur\|POS=ADJ`, `Gender=Fem\|Number=Plur\|POS=NOUN`, `Definite=Def\|Gender=Masc\|Number=Sing\|POS=ADP\|PronType=Art`, `Gender=Fem\|Number=Sing\|POS=PROPN`, `Gender=Fem\|Number=Sing\|POS=VERB\|VerbForm=Part`, `POS=ADP`, `POS=PRON\|PronType=Rel`, `Mood=Ind\|Number=Sing\|POS=VERB\|Person=3\|Tense=Pres\|VerbForm=Fin`, `POS=SCONJ`, `POS=VERB\|VerbForm=Inf`, `Definite=Def\|Gender=Masc\|Number=Plur\|POS=DET\|PronType=Art`, `Gender=Masc\|Number=Plur\|POS=ADJ`, `POS=CCONJ`, `Definite=Def\|Gender=Fem\|Number=Plur\|POS=DET\|PronType=Art`, `Definite=Def\|Gender=Fem\|Number=Sing\|POS=DET\|PronType=Art`, `Definite=Ind\|Gender=Fem\|Number=Sing\|POS=DET\|PronType=Art`, `Gender=Masc\|Number=Sing\|POS=DET\|PronType=Ind`, `Mood=Sub\|Number=Sing\|POS=AUX\|Person=3\|Tense=Pres\|VerbForm=Fin`, `Definite=Def\|Gender=Masc\|Number=Plur\|POS=ADP\|PronType=Art`, `Gender=Masc\|Number=Plur\|POS=PRON\|PronType=Rel`, `Gender=Fem\|Number=Sing\|POS=PRON\|Person=3\|PronType=Prs`, `Mood=Ind\|Number=Plur\|POS=VERB\|Person=3\|Tense=Pres\|VerbForm=Fin`, `POS=ADV\|Polarity=Neg`, `Gender=Masc\|Number=Sing\|POS=DET\|PronType=Art`, `POS=X`, `Gender=Masc\|Number=Plur\|POS=PRON\|PronType=Dem`, `Gender=Fem\|Number=Plur\|POS=DET\|PronType=Ind`, `Mood=Ind\|Number=Plur\|POS=VERB\|Person=1\|Tense=Pres\|VerbForm=Fin`, `Gender=Masc\|Number=Plur\|POS=PRON\|PronType=Tot`, `Case=Acc\|Gender=Masc\|Mood=Ind\|Number=Plur\|POS=VERB\|Person=1\|PronType=Prs\|Tense=Pres\|VerbForm=Fin`, `Number=Sing\|POS=CCONJ`, `Gender=Masc\|Number=Sing\|POS=VERB\|VerbForm=Part`, `Gender=Masc\|Number=Plur\|POS=DET\|PronType=Dem`, `Case=Acc\|Gender=Masc\|Number=Plur\|POS=VERB\|Person=3\|PronType=Prs\|VerbForm=Inf`, `Gender=Masc\|Number=Sing\|POS=DET\|PronType=Dem`, `Gender=Masc\|Number=Sing\|POS=PRON\|PronType=Rel`, `Case=Acc\|Gender=Fem\|Number=Plur\|POS=VERB\|Person=3\|PronType=Prs\|VerbForm=Inf`, `Gender=Fem\|Number=Plur\|POS=PRON\|PronType=Ind`, `Gender=Masc\|Number=Plur\|POS=DET\|PronType=Prs`, `Case=Acc\|Gender=Masc\|Mood=Sub\|Number=Plur\|POS=VERB\|Person=3\|PronType=Prs\|Tense=Pres\|VerbForm=Fin`, `Number=Plur\|POS=NOUN`, `Mood=Sub\|Number=Plur\|POS=VERB\|Person=3\|Tense=Fut\|VerbForm=Fin`, `POS=AUX\|VerbForm=Inf`, `Gender=Fem\|Number=Plur\|POS=VERB\|VerbForm=Part\|Voice=Pass`, `Case=Nom\|Gender=Masc\|Number=Plur\|POS=PRON\|Person=3\|PronType=Prs`, `Gender=Masc\|Number=Sing\|POS=ADP\|PronType=Dem`, `Gender=Masc\|Number=Sing\|POS=PRON\|PronType=Dem`, `POS=VERB\|VerbForm=Ger`, `Mood=Ind\|Number=Plur\|POS=AUX\|Person=3\|Tense=Pres\|VerbForm=Fin`, `Gender=Masc\|Number=Plur\|POS=VERB\|VerbForm=Part\|Voice=Pass`, `Gender=Masc\|Number=Plur\|POS=PROPN`, `Number=Plur\|POS=AUX\|Person=3\|VerbForm=Inf`, `Gender=Fem\|Number=Sing\|POS=PRON\|PronType=Dem`, `Mood=Ind\|Number=Sing\|POS=VERB\|Person=3\|Tense=Fut\|VerbForm=Fin`, `Gender=Masc\|Number=Plur\|POS=PRON\|PronType=Ind`, `Mood=Ind\|Number=Plur\|POS=VERB\|Person=3\|Tense=Past\|VerbForm=Fin`, `Definite=Def\|Gender=Masc\|Number=Sing\|POS=PRON\|PronType=Art`, `POS=VERB\|VerbForm=Part`, `Gender=Masc\|NumType=Ord\|Number=Sing\|POS=ADJ`, `Mood=Ind\|Number=Sing\|POS=VERB\|Person=3\|Tense=Past\|VerbForm=Fin`, `Gender=Fem\|Number=Sing\|POS=DET\|PronType=Dem`, `Definite=Ind\|Gender=Fem\|Number=Sing\|POS=ADP\|PronType=Art`, `Gender=Fem\|Number=Sing\|POS=PRON\|PronType=Rel`, `Mood=Sub\|Number=Sing\|POS=VERB\|Person=3\|Tense=Pres\|VerbForm=Fin`, `Definite=Def\|Gender=Fem\|Number=Sing\|POS=ADP\|PronType=Art`, `Mood=Ind\|Number=Sing\|POS=AUX\|Person=3\|Tense=Past\|VerbForm=Fin`, `Case=Acc\|Gender=Masc\|Mood=Ind\|Number=Sing\|POS=VERB\|Person=3\|PronType=Prs\|Tense=Pres\|VerbForm=Fin`, `Case=Acc\|Gender=Masc\|Number=Plur\|POS=PRON\|Person=3\|PronType=Prs`, `Gender=Masc\|Number=Sing\|POS=VERB\|VerbForm=Part\|Voice=Pass`, `Case=Dat\|Gender=Masc\|Number=Sing\|POS=PRON\|Person=3\|PronType=Prs`, `Mood=Ind\|Number=Sing\|POS=VERB\|Person=1\|Tense=Pres\|VerbForm=Fin`, `Case=Nom\|Number=Plur\|POS=PRON\|Person=1\|PronType=Prs`, `Mood=Sub\|Number=Plur\|POS=VERB\|Person=1\|Tense=Imp\|VerbForm=Fin`, `Mood=Sub\|Number=Sing\|POS=VERB\|Person=3\|Tense=Fut\|VerbForm=Fin`, `Gender=Fem\|NumType=Ord\|Number=Plur\|POS=ADJ`, `Gender=Fem\|Number=Plur\|POS=DET\|PronType=Prs`, `Gender=Masc\|Number=Plur\|POS=DET\|PronType=Ind`, `Gender=Masc\|NumType=Ord\|Number=Plur\|POS=ADJ`, `Case=Acc\|Gender=Masc\|Mood=Ind\|Number=Plur\|POS=VERB\|Person=3\|PronType=Prs\|Tense=Pres\|VerbForm=Fin`, `NumType=Ord\|POS=ADJ`, `Definite=Def` |