Tr Core News Trf
模型概述
這是一個基於轉換器的土耳其語自然語言處理模型,專為SpaCy框架設計,支持多種NLP任務,包括詞性標註、形態分析、命名實體識別等。
模型特點
全面的NLP組件
包含轉換器、標記器、形態分析器、詞形還原器、解析器和命名實體識別器,覆蓋多種NLP任務。
高性能
在NER任務上F值達到0.913,詞性標註準確率達到0.917,表現出色。
基於轉換器架構
使用dbmdz土耳其BERT模型(區分大小寫)作為基礎,具有強大的語言理解能力。
模型能力
詞性標註
形態分析
詞形還原
依存句法分析
命名實體識別
句子分割
使用案例
文本處理
土耳其語文本分析
對土耳其語文本進行全面的語言學分析,包括詞性標註、形態分析等。
準確識別文本中的詞性、形態特徵和句法關係
信息提取
命名實體識別
從土耳其語文本中識別和分類命名實體,如人名、地名等。
NER F值達到0.913
標籤:
- spacy
- 標記分類 語言:
- tr 許可證: cc-by-sa-4.0 模型索引:
- 名稱: tr_core_news_trf
結果:
- 任務:
名稱: NER
類型: 標記分類
指標:
- 名稱: NER精確率 類型: 精確率 值: 0.9135450185
- 名稱: NER召回率 類型: 召回率 值: 0.9127138178
- 名稱: NER F值 類型: f_score 值: 0.913129229
- 任務:
名稱: TAG
類型: 標記分類
指標:
- 名稱: TAG (XPOS)準確率 類型: 準確率 值: 0.9174219957
- 任務:
名稱: POS
類型: 標記分類
指標:
- 名稱: POS (UPOS)準確率 類型: 準確率 值: 0.9094402673
- 任務:
名稱: MORPH
類型: 標記分類
指標:
- 名稱: 形態(UFeats)準確率 類型: 準確率 值: 0.9145220588
- 任務:
名稱: LEMMA
類型: 標記分類
指標:
- 名稱: 詞形還原準確率 類型: 準確率 值: 0.8782380178
- 任務:
名稱: 無標記依存關係
類型: 標記分類
指標:
- 名稱: 無標記附著分數(UAS) 類型: f_score 值: 0.7988988989
- 任務:
名稱: 有標記依存關係
類型: 標記分類
指標:
- 名稱: 有標記附著分數(LAS) 類型: f_score 值: 0.7189673288
- 任務:
名稱: 句子
類型: 標記分類
指標:
- 名稱: 句子F值 類型: f_score 值: 0.8765432099
- 任務:
名稱: NER
類型: 標記分類
指標:
土耳其語轉換器管道,用於TrSpaCy。組件包括:轉換器、標記器、形態分析器、詞形還原器、解析器、命名實體識別器。
特性 | 描述 |
---|---|
名稱 | tr_core_news_trf |
版本 | 3.4.2 |
spaCy | >=3.4.2,<3.5.0 |
默認管道 | transformer , tagger , morphologizer , trainable_lemmatizer , parser , ner |
組件 | transformer , tagger , morphologizer , trainable_lemmatizer , parser , ner |
向量 | 0個鍵,0個唯一向量(0維) |
來源 | UD土耳其BOUN (Türk, Utku; Atmaca, Furkan; Özateş, Şaziye Betül; Berk, Gözde; Bedir, Seyyit Talha; Köksal, Abdullatif; Öztürk Başaran, Balkız; Güngör, Tunga; Özgür, Arzucan) 土耳其維基NER數據集 (Duygu Altinok, Co-one Istanbul) PANX/WikiANN (Xiaoman Pan, Boliang Zhang, Jonathan May, Joel Nothman, Kevin Knight, Heng Ji) dbmdz土耳其BERT模型(區分大小寫) (Bayerische Staatsbibliothek) |
許可證 | cc-by-sa-4.0 |
作者 | Duygu |
標籤方案
查看標籤方案(4個組件的1572個標籤)
組件 | 標籤 |
---|---|
tagger |
ADP , ADV , ANum , ANum_Adj , ANum_Ness , ANum_Noun , ANum_With , ANum_Zero , Abr , Abr_With , Adj , Adj_Ness , Adj_With , Adj_Without , Adj_Zero , Adv , Adverb , Adverb_Adverb , Adverb_Noun , Adverb_Zero , Conj , Conj_Conj , DET , Demons , Demons_Zero , Det , Det_Zero , Dup , Interj , NAdj , NAdj_Aux , NAdj_Ness , NAdj_Noun , NAdj_Rel , NAdj_Verb , NAdj_With , NAdj_Without , NAdj_Zero , NNum , NNum_Rel , NNum_Zero , NOUN , Neg , Ness , Noun , Noun_Ness , Noun_Noun , Noun_Rel , Noun_Since , Noun_Verb , Noun_With , Noun_With_Ness , Noun_With_Verb , Noun_With_Zero , Noun_Without , Noun_Zero , PCAbl , PCAbl_Rel , PCAcc , PCDat , PCDat_Zero , PCGen , PCIns , PCIns_Zero , PCNom , PCNom_Adj , PCNom_Noun , PCNom_Zero , PRON , PUNCT , Pers , Pers_Ness , Pers_Pers , Pers_Rel , Pers_Zero , Postp , Prop , Prop_Conj , Prop_Rel , Prop_Since , Prop_With , Prop_Zero , Punc , Punc_Noun_Ness , Punc_Noun_Rel , Quant , Quant_Zero , Ques , Ques_Zero , Reflex , Reflex_Zero , Rel , SYM , Since , Since_Since , Verb , Verb_Conj , Verb_Ness , Verb_Noun , Verb_Verb , Verb_With , Verb_Zero , With , Without , Without_Zero , Zero |
morphologizer |
NumType=Card|POS=NUM , Aspect=Perf|Case=Loc|Mood=Ind|Number=Plur,Sing|Number[psor]=Sing|POS=NOUN|Person=1,3|Person[psor]=3|Tense=Pres , POS=PUNCT , POS=ADV , POS=NOUN , Case=Nom|Number=Sing|POS=ADJ|Person=3 , POS=DET , Case=Loc|Number=Sing|POS=VERB|Person=1 , Case=Nom|Number=Sing|POS=PRON|Person=3|PronType=Prs , Case=Dat|Number=Sing|POS=VERB|Person=3 , POS=ADJ , Aspect=Perf|Case=Nom|Number=Sing|Number[psor]=Sing|POS=VERB|Person=3|Person[psor]=3|Polarity=Pos|Tense=Past|VerbForm=Part , Case=Gen|Number=Sing|POS=NOUN|Person=3 , POS=PRON , Case=Nom|Number=Sing|POS=NOUN|Person=3 , Aspect=Perf|Case=Acc|Number=Sing|Number[psor]=Sing|POS=VERB|Person=3|Person[psor]=3|Polarity=Pos|Tense=Past|VerbForm=Part , POS=VERB|Polarity=Pos|Tense=Pres|VerbForm=Part , Case=Acc|Number=Plur|POS=NOUN|Person=3 , Aspect=Perf|Evident=Fh|Number=Sing|POS=VERB|Person=3|Tense=Past , Case=Nom|Number=Sing|POS=PROPN|Person=3 , Case=Dat|Number=Sing|POS=PROPN|Person=3 , POS=VERB|Polarity=Pos , Case=Acc|Number=Sing|POS=VERB|Person=3|Polarity=Pos , Aspect=Perf|Evident=Fh|Number=Sing|POS=VERB|Person=3|Polarity=Pos|Tense=Past , Aspect=Prog|Evident=Fh|Number=Sing|POS=VERB|Person=3|Polarity=Pos|Tense=Past , Case=Abl|Number=Sing|POS=ADJ|Person=3 , Case=Nom|Number=Plur|POS=NOUN|Person=3 , Case=Loc|Number=Plur|Number[psor]=Sing|POS=NOUN|Person=3|Person[psor]=3 , POS=INTJ , Case=Abl|Number=Plur|Number[psor]=Sing|POS=NOUN|Person=3|Person[psor]=3 , Case=Ins|Number=Sing|POS=PROPN|Person=3 , Case=Loc|Number=Sing|POS=PROPN|Person=3 , Case=Acc|Number=Sing|POS=NOUN|Person=3 , Aspect=Imp|POS=VERB|Polarity=Pos|Tense=Fut|VerbForm=Part , Case=Nom|Number=Sing|POS=PRON|Person=3 , POS=CCONJ , Case=Nom|Number=Plur|Number[psor]=Sing|POS=NOUN|Person=3|Person[psor]=3 , Case=Nom|Mood=Imp|Number=Sing|POS=VERB|Person=3|Polarity=Pos|VerbForm=Conv|Voice=Cau , Case=Dat|Number=Sing|Number[psor]=Plur|POS=ADJ|Person=3|Person[psor]=1 , Aspect=Prog|Number=Sing|POS=VERB|Person=3|Polarity=Pos|Tense=Pres , Case=Gen|Number=Sing|POS=PROPN|Person=3 , Case=Abl|Number=Sing|Number[psor]=Sing|POS=NOUN|Person=3|Person[psor]=3 , Case=Nom|Number=Sing|POS=ADP|Person=3 , Case=Dat|Number=Plur|POS=NOUN|Person=3 , Aspect=Perf|Evident=Fh|Number=Sing|POS=VERB|Person=3|Polarity=Pos|Tense=Past|Voice=Pass , Case=Nom|POS=VERB|Polarity=Pos , Case=Nom|Number=Sing|POS=VERB|Person=3 , Case=Loc|Number=Sing|Number[psor]=Sing|POS=NOUN|Person=3|Person[psor]=3 , Case=Nom|Number=Sing|POS=VERB|Person=3|Polarity=Pos|Voice=Cau , Case=Dat|Number=Sing|Number[psor]=Sing|POS=NOUN|Person=3|Person[psor]=3 , Case=Acc|Number=Sing|POS=PROPN|Person=3 , Aspect=Imp|Number=Sing|POS=VERB|Person=3|Polarity=Pos|Tense=Fut , POS=ADP , Aspect=Perf|Evident=Fh|Number=Sing|POS=VERB|Person=1|Polarity=Pos|Tense=Past|Voice=Pass , Evident=Nfh|Number=Sing|POS=VERB|Person=3|Polarity=Pos|Tense=Past , Case=Nom|Number=Sing|Number[psor]=Sing|POS=NOUN|Person=3|Person[psor]=1 , Aspect=Perf|Number[psor]=Sing|POS=VERB|Person[psor]=3|Polarity=Pos|Tense=Past|VerbForm=Part , Aspect=Perf|Case=Nom|Number=Sing|Number[psor]=Sing|POS=VERB|Person=3|Person[psor]=3|Polarity=Neg|Tense=Past|VerbForm=Part , Case=Acc|Number=Plur|POS=PRON|Person=3 , `Aspect=Perf|Number[psor]=Sing|POS=VERB |
Indonesian Roberta Base Posp Tagger
MIT
這是一個基於印尼語RoBERTa模型微調的詞性標註模型,在indonlu數據集上訓練,用於印尼語文本的詞性標註任務。
序列標註
Transformers 其他

I
w11wo
2.2M
7
Bert Base NER
MIT
基於BERT微調的命名實體識別模型,可識別四類實體:地點(LOC)、組織機構(ORG)、人名(PER)和雜項(MISC)
序列標註 英語
B
dslim
1.8M
592
Deid Roberta I2b2
MIT
該模型是基於RoBERTa微調的序列標註模型,用於識別和移除醫療記錄中的受保護健康信息(PHI/PII)。
序列標註
Transformers 支持多種語言

D
obi
1.1M
33
Ner English Fast
Flair自帶的英文快速4類命名實體識別模型,基於Flair嵌入和LSTM-CRF架構,在CoNLL-03數據集上達到92.92的F1分數。
序列標註
PyTorch 英語
N
flair
978.01k
24
French Camembert Postag Model
基於Camembert-base的法語詞性標註模型,使用free-french-treebank數據集訓練
序列標註
Transformers 法語

F
gilf
950.03k
9
Xlm Roberta Large Ner Spanish
基於XLM-Roberta-large架構微調的西班牙語命名實體識別模型,在CoNLL-2002數據集上表現優異。
序列標註
Transformers 西班牙語

X
MMG
767.35k
29
Nusabert Ner V1.3
MIT
基於NusaBert-v1.3在印尼語NER任務上微調的命名實體識別模型
序列標註
Transformers 其他

N
cahya
759.09k
3
Ner English Large
Flair框架內置的英文4類大型NER模型,基於文檔級XLM-R嵌入和FLERT技術,在CoNLL-03數據集上F1分數達94.36。
序列標註
PyTorch 英語
N
flair
749.04k
44
Punctuate All
MIT
基於xlm-roberta-base微調的多語言標點符號預測模型,支持12種歐洲語言的標點符號自動補全
序列標註
Transformers

P
kredor
728.70k
20
Xlm Roberta Ner Japanese
MIT
基於xlm-roberta-base微調的日語命名實體識別模型
序列標註
Transformers 支持多種語言

X
tsmatz
630.71k
25
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98