Indonesian Roberta Base Posp Tagger
MIT
这是一个基于印尼语RoBERTa模型微调的词性标注模型,在indonlu数据集上训练,用于印尼语文本的词性标注任务。
序列标注
Transformers 其他

I
w11wo
2.2M
7
Bert Base NER
MIT
基于BERT微调的命名实体识别模型,可识别四类实体:地点(LOC)、组织机构(ORG)、人名(PER)和杂项(MISC)
序列标注 英语
B
dslim
1.8M
592
Deid Roberta I2b2
MIT
该模型是基于RoBERTa微调的序列标注模型,用于识别和移除医疗记录中的受保护健康信息(PHI/PII)。
序列标注
Transformers 支持多种语言

D
obi
1.1M
33
Ner English Fast
Flair自带的英文快速4类命名实体识别模型,基于Flair嵌入和LSTM-CRF架构,在CoNLL-03数据集上达到92.92的F1分数。
序列标注 英语
N
flair
978.01k
24
French Camembert Postag Model
基于Camembert-base的法语词性标注模型,使用free-french-treebank数据集训练
序列标注
Transformers 法语

F
gilf
950.03k
9
Xlm Roberta Large Ner Spanish
基于XLM-Roberta-large架构微调的西班牙语命名实体识别模型,在CoNLL-2002数据集上表现优异。
序列标注
Transformers 西班牙语

X
MMG
767.35k
29
Nusabert Ner V1.3
MIT
基于NusaBert-v1.3在印尼语NER任务上微调的命名实体识别模型
序列标注
Transformers 其他

N
cahya
759.09k
3
Ner English Large
Flair框架内置的英文4类大型NER模型,基于文档级XLM-R嵌入和FLERT技术,在CoNLL-03数据集上F1分数达94.36。
序列标注 英语
N
flair
749.04k
44
Punctuate All
MIT
基于xlm-roberta-base微调的多语言标点符号预测模型,支持12种欧洲语言的标点符号自动补全
序列标注
Transformers

P
kredor
728.70k
20
Xlm Roberta Ner Japanese
MIT
基于xlm-roberta-base微调的日语命名实体识别模型
序列标注
Transformers 支持多种语言

X
tsmatz
630.71k
25
Gliner Medium News V2.1
Apache-2.0
基于GLiNER的微调版本,专为新闻实体抽取优化,在18个基准测试中零样本准确率最高提升7.5%
序列标注 英语
G
EmergentMethods
532.81k
75
Fullstop Punctuation Multilang Large
MIT
一个用于预测英语、意大利语、法语和德语文本标点符号的多语言模型,旨在恢复转录口语的标点结构。
序列标注
Transformers 支持多种语言

F
oliverguhr
375.32k
163
Bert Base Multilingual Cased Ner Hrl
基于mBERT的多语言命名实体识别模型,支持10种高资源语言,能识别地点、组织和人名三类实体。
序列标注
Transformers

B
Davlan
363.27k
72
Bert Large NER
MIT
基于BERT-large微调的命名实体识别模型,在CoNLL-2003数据集上实现最先进性能
序列标注 英语
B
dslim
360.98k
150
Ner French
Flair自带的法语标准4类NER模型,基于Flair词嵌入和LSTM-CRF架构,在WikiNER数据集上F1分数为90.61。
序列标注 法语
N
flair
335.11k
13
Ner German Large
Flair框架内置的德语4类大型命名实体识别模型,基于XLM-R嵌入和FLERT技术,在CoNLL-03德语数据集上达到92.31的F1分数。
序列标注 德语
N
flair
297.28k
40
Xlm Roberta Base Romanian Ner Ronec
基于xlm-roberta模型在罗马尼亚语NER数据集RONEC上训练的命名实体识别模型,测试集f1-Macro达到95分。
序列标注
Transformers 其他

X
EvanD
283.26k
3
Distilbert Base Multilingual Cased Ner Hrl
一个面向10种高资源语言的命名实体识别模型,基于微调的Distil BERT基础模型,能够识别地点、组织和人物三类实体。
序列标注
Transformers

D
Davlan
270.56k
78
Wikineural Multilingual Ner
基于神经网络与知识库融合的多语言命名实体识别模型,支持9种语言
序列标注
Transformers 支持多种语言

W
Babelscape
258.08k
142
Roberta Large Ner English
MIT
基于RoBERTa-large微调的英语命名实体识别模型,在conll2003数据集上训练,特别优化了电子邮件/聊天数据的实体识别能力。
序列标注
Transformers 英语

R
Jean-Baptiste
236.85k
71
Camembert Ner
MIT
基于camemBERT在wikiner-fr数据集上微调的命名实体识别(NER)模型,擅长处理法语文本中的命名实体识别任务。
序列标注
Transformers 法语

C
Jean-Baptiste
230.81k
110
Camembert Ner With Dates
MIT
基于camemBERT微调的法语命名实体识别模型,新增了日期标签功能
序列标注
Transformers 法语

C
Jean-Baptiste
219.11k
43
Ner English Ontonotes Large
Flair自带的英语18类命名实体识别大模型,基于Ontonotes数据集训练,采用XLM-R嵌入和FLERT技术。
序列标注 英语
N
flair
176.21k
96
Ner English Ontonotes
Flair自带的英文18类命名实体识别模型,基于Ontonotes数据集训练,F1分数89.27。
序列标注 英语
N
flair
175.71k
19
Roberta Large Tweetner7 All
基于roberta-large在tner/tweetner7数据集上微调的命名实体识别模型,专门用于推特文本中的实体识别
序列标注
Transformers

R
tner
170.06k
1
Sat 3l Sm
MIT
采用3层Transformer架构的顶尖句子分割技术,支持多语言文本分割。
序列标注
Transformers 支持多种语言

S
segment-any-text
168.01k
6
Albert Tiny Chinese Ws
Gpl-3.0
提供繁体中文的transformers模型及自然语言处理工具
序列标注
Transformers 中文

A
ckiplab
166.28k
6
Ner Dutch Large
Flair自带的荷兰语4类命名实体识别大模型,基于XLM-R嵌入和FLERT技术,在CoNLL-03荷兰语数据集上F1分数达95.25。
序列标注 其他
N
flair
147.32k
9
Layoutreader
一款阅读顺序预测模型,可将从PDF提取或通过OCR检测的文本框转换为可读顺序。
序列标注
Transformers

L
hantian
139.61k
27
Deid Bert I2b2
MIT
该模型用于识别和移除医疗记录中的受保护健康信息(PHI/PII),符合HIPAA隐私标准。
序列标注
Transformers 支持多种语言

D
obi
129.39k
21
Bert Base NER Russian
MIT
基于bert-base-multilingual-cased微调的俄语文本命名实体识别(NER)模型,采用BIOLU标注格式,可识别人名、地点、机构等多种实体类型。
序列标注
Transformers 其他

B
Gherman
128.72k
7
Ner English
Flair自带的英语标准4类命名实体识别模型,基于Flair嵌入和LSTM-CRF架构,在CoNLL-03数据集上达到93.06的F1分数。
序列标注 英语
N
flair
127.67k
34
Piiranha V1 Detect Personal Information
Piiranha-v1 是基于 microsoft/mdeberta-v3-base 微调的模型,专为检测六种语言中的17类个人身份信息(PII)而设计。
序列标注
Transformers 支持多种语言

P
iiiorg
125.41k
181
Bert Base Turkish Cased Ner
MIT
基于dbmdz/bert-base-turkish-cased模型微调的土耳其语命名实体识别模型,支持识别人名、组织名和地名等实体。
序列标注
Transformers 其他

B
akdeniz27
115.25k
23
Biomedical Ner All
Apache-2.0
基于distilbert-base-uncased训练的英文命名实体识别模型,专为识别生物医学实体(107种实体类别)设计,适用于病例报告等文本语料。
序列标注
Transformers 英语

B
d4data
112.41k
165
Bpmn Information Extraction V2
Apache-2.0
基于bert-base-cased微调的BPMN流程信息抽取模型,用于从文本化流程描述中提取执行者、任务等关键元素
序列标注
Transformers

B
jtlicardo
112.15k
14
Zh Wiki Punctuation Restore
一个用于中文维基百科文本的标点符号恢复工具,支持恢复6种常见标点符号。
序列标注
Transformers 支持多种语言

Z
p208p2002
102.99k
11
Xlm Roberta Large Finetuned Conll03 English
基于XLM-RoBERTa-large模型在英语conll2003数据集上微调的命名实体识别模型
序列标注 支持多种语言
X
FacebookAI
84.75k
169
Bert English Uncased Finetuned Pos
一个用于中文词性标注的模型,支持常见的17种词性标签。
序列标注
B
vblagoje
79.89k
40
Bert Spanish Cased Finetuned Ner
基于西班牙语BERT大小写版本(BETO)在NER-C数据集上微调后的版本,专用于命名实体识别(NER)任务。
序列标注 西班牙语
B
mrm8488
77.49k
21
Bert Fa Base Uncased Ner Peyma
Apache-2.0
基于Transformer的波斯语理解模型,重构词汇表并在新语料库上微调,拓展了多领域应用功能
序列标注 其他
B
HooshvareLab
69.74k
7
Gliner Multi Pii V1
Apache-2.0
GLiNER 是一种命名实体识别(NER)模型,能够识别多种类型的个人身份信息(PII)。
序列标注
PyTorch 支持多种语言
G
urchade
67.78k
107
- 1
- 2
- 3
- 4
- 5
- 6
- 10