Indonesian Roberta Base Posp Tagger
MIT
這是一個基於印尼語RoBERTa模型微調的詞性標註模型,在indonlu數據集上訓練,用於印尼語文本的詞性標註任務。
序列標註
Transformers 其他

I
w11wo
2.2M
7
Bert Base NER
MIT
基於BERT微調的命名實體識別模型,可識別四類實體:地點(LOC)、組織機構(ORG)、人名(PER)和雜項(MISC)
序列標註 英語
B
dslim
1.8M
592
Deid Roberta I2b2
MIT
該模型是基於RoBERTa微調的序列標註模型,用於識別和移除醫療記錄中的受保護健康信息(PHI/PII)。
序列標註
Transformers 支持多種語言

D
obi
1.1M
33
Ner English Fast
Flair自帶的英文快速4類命名實體識別模型,基於Flair嵌入和LSTM-CRF架構,在CoNLL-03數據集上達到92.92的F1分數。
序列標註 英語
N
flair
978.01k
24
French Camembert Postag Model
基於Camembert-base的法語詞性標註模型,使用free-french-treebank數據集訓練
序列標註
Transformers 法語

F
gilf
950.03k
9
Xlm Roberta Large Ner Spanish
基於XLM-Roberta-large架構微調的西班牙語命名實體識別模型,在CoNLL-2002數據集上表現優異。
序列標註
Transformers 西班牙語

X
MMG
767.35k
29
Nusabert Ner V1.3
MIT
基於NusaBert-v1.3在印尼語NER任務上微調的命名實體識別模型
序列標註
Transformers 其他

N
cahya
759.09k
3
Ner English Large
Flair框架內置的英文4類大型NER模型,基於文檔級XLM-R嵌入和FLERT技術,在CoNLL-03數據集上F1分數達94.36。
序列標註 英語
N
flair
749.04k
44
Punctuate All
MIT
基於xlm-roberta-base微調的多語言標點符號預測模型,支持12種歐洲語言的標點符號自動補全
序列標註
Transformers

P
kredor
728.70k
20
Xlm Roberta Ner Japanese
MIT
基於xlm-roberta-base微調的日語命名實體識別模型
序列標註
Transformers 支持多種語言

X
tsmatz
630.71k
25
Gliner Medium News V2.1
Apache-2.0
基於GLiNER的微調版本,專為新聞實體抽取優化,在18個基準測試中零樣本準確率最高提升7.5%
序列標註 英語
G
EmergentMethods
532.81k
75
Fullstop Punctuation Multilang Large
MIT
一個用於預測英語、意大利語、法語和德語文本標點符號的多語言模型,旨在恢復轉錄口語的標點結構。
序列標註
Transformers 支持多種語言

F
oliverguhr
375.32k
163
Bert Base Multilingual Cased Ner Hrl
基於mBERT的多語言命名實體識別模型,支持10種高資源語言,能識別地點、組織和人名三類實體。
序列標註
Transformers

B
Davlan
363.27k
72
Bert Large NER
MIT
基於BERT-large微調的命名實體識別模型,在CoNLL-2003數據集上實現最先進性能
序列標註 英語
B
dslim
360.98k
150
Ner French
Flair自帶的法語標準4類NER模型,基於Flair詞嵌入和LSTM-CRF架構,在WikiNER數據集上F1分數為90.61。
序列標註 法語
N
flair
335.11k
13
Ner German Large
Flair框架內置的德語4類大型命名實體識別模型,基於XLM-R嵌入和FLERT技術,在CoNLL-03德語數據集上達到92.31的F1分數。
序列標註 德語
N
flair
297.28k
40
Xlm Roberta Base Romanian Ner Ronec
基於xlm-roberta模型在羅馬尼亞語NER數據集RONEC上訓練的命名實體識別模型,測試集f1-Macro達到95分。
序列標註
Transformers 其他

X
EvanD
283.26k
3
Distilbert Base Multilingual Cased Ner Hrl
一個面向10種高資源語言的命名實體識別模型,基於微調的Distil BERT基礎模型,能夠識別地點、組織和人物三類實體。
序列標註
Transformers

D
Davlan
270.56k
78
Wikineural Multilingual Ner
基於神經網絡與知識庫融合的多語言命名實體識別模型,支持9種語言
序列標註
Transformers 支持多種語言

W
Babelscape
258.08k
142
Roberta Large Ner English
MIT
基於RoBERTa-large微調的英語命名實體識別模型,在conll2003數據集上訓練,特別優化了電子郵件/聊天數據的實體識別能力。
序列標註
Transformers 英語

R
Jean-Baptiste
236.85k
71
Camembert Ner
MIT
基於camemBERT在wikiner-fr數據集上微調的命名實體識別(NER)模型,擅長處理法語文本中的命名實體識別任務。
序列標註
Transformers 法語

C
Jean-Baptiste
230.81k
110
Camembert Ner With Dates
MIT
基於camemBERT微調的法語命名實體識別模型,新增了日期標籤功能
序列標註
Transformers 法語

C
Jean-Baptiste
219.11k
43
Ner English Ontonotes Large
Flair自帶的英語18類命名實體識別大模型,基於Ontonotes數據集訓練,採用XLM-R嵌入和FLERT技術。
序列標註 英語
N
flair
176.21k
96
Ner English Ontonotes
Flair自帶的英文18類命名實體識別模型,基於Ontonotes數據集訓練,F1分數89.27。
序列標註 英語
N
flair
175.71k
19
Roberta Large Tweetner7 All
基於roberta-large在tner/tweetner7數據集上微調的命名實體識別模型,專門用於推特文本中的實體識別
序列標註
Transformers

R
tner
170.06k
1
Sat 3l Sm
MIT
採用3層Transformer架構的頂尖句子分割技術,支持多語言文本分割。
序列標註
Transformers 支持多種語言

S
segment-any-text
168.01k
6
Albert Tiny Chinese Ws
Gpl-3.0
提供繁體中文的transformers模型及自然語言處理工具
序列標註
Transformers 中文

A
ckiplab
166.28k
6
Ner Dutch Large
Flair自帶的荷蘭語4類命名實體識別大模型,基於XLM-R嵌入和FLERT技術,在CoNLL-03荷蘭語數據集上F1分數達95.25。
序列標註 其他
N
flair
147.32k
9
Layoutreader
一款閱讀順序預測模型,可將從PDF提取或通過OCR檢測的文本框轉換為可讀順序。
序列標註
Transformers

L
hantian
139.61k
27
Deid Bert I2b2
MIT
該模型用於識別和移除醫療記錄中的受保護健康信息(PHI/PII),符合HIPAA隱私標準。
序列標註
Transformers 支持多種語言

D
obi
129.39k
21
Bert Base NER Russian
MIT
基於bert-base-multilingual-cased微調的俄語文本命名實體識別(NER)模型,採用BIOLU標註格式,可識別人名、地點、機構等多種實體類型。
序列標註
Transformers 其他

B
Gherman
128.72k
7
Ner English
Flair自帶的英語標準4類命名實體識別模型,基於Flair嵌入和LSTM-CRF架構,在CoNLL-03數據集上達到93.06的F1分數。
序列標註 英語
N
flair
127.67k
34
Piiranha V1 Detect Personal Information
Piiranha-v1 是基於 microsoft/mdeberta-v3-base 微調的模型,專為檢測六種語言中的17類個人身份信息(PII)而設計。
序列標註
Transformers 支持多種語言

P
iiiorg
125.41k
181
Bert Base Turkish Cased Ner
MIT
基於dbmdz/bert-base-turkish-cased模型微調的土耳其語命名實體識別模型,支持識別人名、組織名和地名等實體。
序列標註
Transformers 其他

B
akdeniz27
115.25k
23
Biomedical Ner All
Apache-2.0
基於distilbert-base-uncased訓練的英文命名實體識別模型,專為識別生物醫學實體(107種實體類別)設計,適用於病例報告等文本語料。
序列標註
Transformers 英語

B
d4data
112.41k
165
Bpmn Information Extraction V2
Apache-2.0
基於bert-base-cased微調的BPMN流程信息抽取模型,用於從文本化流程描述中提取執行者、任務等關鍵元素
序列標註
Transformers

B
jtlicardo
112.15k
14
Zh Wiki Punctuation Restore
一個用於中文維基百科文本的標點符號恢復工具,支持恢復6種常見標點符號。
序列標註
Transformers 支持多種語言

Z
p208p2002
102.99k
11
Xlm Roberta Large Finetuned Conll03 English
基於XLM-RoBERTa-large模型在英語conll2003數據集上微調的命名實體識別模型
序列標註 支持多種語言
X
FacebookAI
84.75k
169
Bert English Uncased Finetuned Pos
一個用於中文詞性標註的模型,支持常見的17種詞性標籤。
序列標註
B
vblagoje
79.89k
40
Bert Spanish Cased Finetuned Ner
基於西班牙語BERT大小寫版本(BETO)在NER-C數據集上微調後的版本,專用於命名實體識別(NER)任務。
序列標註 西班牙語
B
mrm8488
77.49k
21
Bert Fa Base Uncased Ner Peyma
Apache-2.0
基於Transformer的波斯語理解模型,重構詞彙表並在新語料庫上微調,拓展了多領域應用功能
序列標註 其他
B
HooshvareLab
69.74k
7
Gliner Multi Pii V1
Apache-2.0
GLiNER 是一種命名實體識別(NER)模型,能夠識別多種類型的個人身份信息(PII)。
序列標註
PyTorch 支持多種語言
G
urchade
67.78k
107
- 1
- 2
- 3
- 4
- 5
- 6
- 10