序列标注

2025年最佳的 781 个序列标注工具

Indonesian Roberta Base Posp Tagger

这是一个基于印尼语RoBERTa模型微调的词性标注模型，在indonlu数据集上训练，用于印尼语文本的词性标注任务。

Transformers 其他

基于BERT微调的命名实体识别模型，可识别四类实体：地点(LOC)、组织机构(ORG)、人名(PER)和杂项(MISC)

序列标注英语

Deid Roberta I2b2

该模型是基于RoBERTa微调的序列标注模型，用于识别和移除医疗记录中的受保护健康信息(PHI/PII)。

Transformers 支持多种语言

Ner English Fast

Flair自带的英文快速4类命名实体识别模型，基于Flair嵌入和LSTM-CRF架构，在CoNLL-03数据集上达到92.92的F1分数。

序列标注英语

French Camembert Postag Model

基于Camembert-base的法语词性标注模型，使用free-french-treebank数据集训练

Transformers 法语

Xlm Roberta Large Ner Spanish

基于XLM-Roberta-large架构微调的西班牙语命名实体识别模型，在CoNLL-2002数据集上表现优异。

Transformers 西班牙语

Nusabert Ner V1.3

基于NusaBert-v1.3在印尼语NER任务上微调的命名实体识别模型

Transformers 其他

Ner English Large

Flair框架内置的英文4类大型NER模型，基于文档级XLM-R嵌入和FLERT技术，在CoNLL-03数据集上F1分数达94.36。

序列标注英语

基于xlm-roberta-base微调的多语言标点符号预测模型，支持12种欧洲语言的标点符号自动补全

Xlm Roberta Ner Japanese

基于xlm-roberta-base微调的日语命名实体识别模型

Transformers 支持多种语言

Gliner Medium News V2.1

基于GLiNER的微调版本，专为新闻实体抽取优化，在18个基准测试中零样本准确率最高提升7.5%

序列标注英语

EmergentMethods

Fullstop Punctuation Multilang Large

一个用于预测英语、意大利语、法语和德语文本标点符号的多语言模型，旨在恢复转录口语的标点结构。

Transformers 支持多种语言

Bert Base Multilingual Cased Ner Hrl

基于mBERT的多语言命名实体识别模型，支持10种高资源语言，能识别地点、组织和人名三类实体。

基于BERT-large微调的命名实体识别模型，在CoNLL-2003数据集上实现最先进性能

序列标注英语

Flair自带的法语标准4类NER模型，基于Flair词嵌入和LSTM-CRF架构，在WikiNER数据集上F1分数为90.61。

序列标注法语

Ner German Large

Flair框架内置的德语4类大型命名实体识别模型，基于XLM-R嵌入和FLERT技术，在CoNLL-03德语数据集上达到92.31的F1分数。

序列标注德语

Xlm Roberta Base Romanian Ner Ronec

基于xlm-roberta模型在罗马尼亚语NER数据集RONEC上训练的命名实体识别模型，测试集f1-Macro达到95分。

Transformers 其他

Distilbert Base Multilingual Cased Ner Hrl

一个面向10种高资源语言的命名实体识别模型，基于微调的Distil BERT基础模型，能够识别地点、组织和人物三类实体。

Wikineural Multilingual Ner

基于神经网络与知识库融合的多语言命名实体识别模型，支持9种语言

Transformers 支持多种语言

Roberta Large Ner English

基于RoBERTa-large微调的英语命名实体识别模型，在conll2003数据集上训练，特别优化了电子邮件/聊天数据的实体识别能力。

Transformers 英语

基于camemBERT在wikiner-fr数据集上微调的命名实体识别（NER）模型，擅长处理法语文本中的命名实体识别任务。

Transformers 法语

Camembert Ner With Dates

基于camemBERT微调的法语命名实体识别模型，新增了日期标签功能

Transformers 法语

Ner English Ontonotes Large

Flair自带的英语18类命名实体识别大模型，基于Ontonotes数据集训练，采用XLM-R嵌入和FLERT技术。

序列标注英语

Ner English Ontonotes

Flair自带的英文18类命名实体识别模型，基于Ontonotes数据集训练，F1分数89.27。

序列标注英语

Roberta Large Tweetner7 All

基于roberta-large在tner/tweetner7数据集上微调的命名实体识别模型，专门用于推特文本中的实体识别

采用3层Transformer架构的顶尖句子分割技术，支持多语言文本分割。

Transformers 支持多种语言

segment-any-text

Albert Tiny Chinese Ws

提供繁体中文的transformers模型及自然语言处理工具

Transformers 中文

Ner Dutch Large

Flair自带的荷兰语4类命名实体识别大模型，基于XLM-R嵌入和FLERT技术，在CoNLL-03荷兰语数据集上F1分数达95.25。

序列标注其他

一款阅读顺序预测模型，可将从PDF提取或通过OCR检测的文本框转换为可读顺序。

该模型用于识别和移除医疗记录中的受保护健康信息(PHI/PII)，符合HIPAA隐私标准。

Transformers 支持多种语言

Bert Base NER Russian

基于bert-base-multilingual-cased微调的俄语文本命名实体识别(NER)模型，采用BIOLU标注格式，可识别人名、地点、机构等多种实体类型。

Transformers 其他

Flair自带的英语标准4类命名实体识别模型，基于Flair嵌入和LSTM-CRF架构，在CoNLL-03数据集上达到93.06的F1分数。

序列标注英语

Piiranha V1 Detect Personal Information

Piiranha-v1 是基于 microsoft/mdeberta-v3-base 微调的模型，专为检测六种语言中的17类个人身份信息（PII）而设计。

Transformers 支持多种语言

Bert Base Turkish Cased Ner

基于dbmdz/bert-base-turkish-cased模型微调的土耳其语命名实体识别模型，支持识别人名、组织名和地名等实体。

Transformers 其他

Biomedical Ner All

基于distilbert-base-uncased训练的英文命名实体识别模型，专为识别生物医学实体（107种实体类别）设计，适用于病例报告等文本语料。

Transformers 英语

Bpmn Information Extraction V2

基于bert-base-cased微调的BPMN流程信息抽取模型，用于从文本化流程描述中提取执行者、任务等关键元素

Zh Wiki Punctuation Restore

一个用于中文维基百科文本的标点符号恢复工具，支持恢复6种常见标点符号。

Transformers 支持多种语言

Xlm Roberta Large Finetuned Conll03 English

基于XLM-RoBERTa-large模型在英语conll2003数据集上微调的命名实体识别模型

序列标注支持多种语言

Bert English Uncased Finetuned Pos

一个用于中文词性标注的模型，支持常见的17种词性标签。

Bert Spanish Cased Finetuned Ner

基于西班牙语BERT大小写版本（BETO）在NER-C数据集上微调后的版本，专用于命名实体识别（NER）任务。

序列标注西班牙语

Bert Fa Base Uncased Ner Peyma

基于Transformer的波斯语理解模型，重构词汇表并在新语料库上微调，拓展了多领域应用功能

序列标注其他

Gliner Multi Pii V1

GLiNER 是一种命名实体识别（NER）模型，能够识别多种类型的个人身份信息（PII）。

PyTorch 支持多种语言

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase