🚀 bertimbau-large-ner-total
本模型卡片旨在簡化葡萄牙語Bert,即Bertimbau在命名實體識別任務中的使用。
在本模型卡片中,我們使用了原始Bertimbau倉庫ner_evaluation文件夾中提供的 BERT - CRF(全場景,10個類別) 模型。
可用的類別如下:
- 人物(PESSOA)
- 組織(ORGANIZACAO)
- 地點(LOCAL)
- 時間(TEMPO)
- 數值(VALOR)
- 抽象概念(ABSTRACCAO)
- 事件(ACONTECIMENTO)
- 事物(COISA)
- 作品(OBRA)
- 其他(OUTRO)
🚀 快速開始
本模型可用於命名實體識別任務,基於葡萄牙語Bert進行適配,能識別多種類型的實體。
📦 安裝指南
此部分原文檔未提及具體安裝步驟,故跳過。
💻 使用示例
基礎用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("marquesafonso/bertimbau-large-ner-total")
model = AutoModelForTokenClassification.from_pretrained("marquesafonso/bertimbau-large-ner-total")
高級用法
from transformers import pipeline
pipe = pipeline("ner", model="marquesafonso/bertimbau-large-ner-total", aggregation_strategy='simple')
sentence = "James Marsh, realizador de filmes como A Teoria de Tudo ou Homem no Arame, assumiu a missão de criar uma obra biográfica sobre Samue Beckett, figura ímpar da literatura e da dramaturgia do século XX. O guião foi escrito pelo escocês Neil Forsyth, vencedor de dois Baftas."
result = pipe([sentence])
print(f"{sentence}\n{result}")
📚 詳細文檔
此部分原文檔未提供詳細說明,故跳過。
🔧 技術細節
此部分原文檔未提供具體的技術實現細節,故跳過。
📄 許可證
本工作是對葡萄牙語Bert,即Bertimbau的改編。你可以查看並/或引用他們的工作:
@InProceedings{souza2020bertimbau,
author="Souza, F{\'a}bio and Nogueira, Rodrigo and Lotufo, Roberto",
editor="Cerri, Ricardo and Prati, Ronaldo C.",
title="BERTimbau: Pretrained BERT Models for Brazilian Portuguese",
booktitle="Intelligent Systems",
year="2020",
publisher="Springer International Publishing",
address="Cham",
pages="403--417",
isbn="978-3-030-61377-8"
}
@article{souza2019portuguese,
title={Portuguese Named Entity Recognition using BERT-CRF},
author={Souza, F{\'a}bio and Nogueira, Rodrigo and Lotufo, Roberto},
journal={arXiv preprint arXiv:1909.10649},
url={http://arxiv.org/abs/1909.10649},
year={2019}
}
請注意,作者 - Fabio Capuano de Souza、Rodrigo Nogueira、Roberto de Alencar Lotufo - 為他們的工作採用了MIT許可證。