🚀 EstBERT_NER
EstBERT_NER是一個經過微調的EstBERT模型,可用於命名實體識別。該模型能夠解決在愛沙尼亞語語境下識別特定實體的問題,為相關自然語言處理任務提供了有效的工具,具有重要的應用價值。
🚀 快速開始
你可以使用Transformers庫的pipeline進行命名實體識別(NER)。由於模型偶爾會將子詞標記為實體,因此可能需要對結果進行後處理。
from transformers import BertTokenizer, BertForTokenClassification
from transformers import pipeline
tokenizer = BertTokenizer.from_pretrained('tartuNLP/EstBERT_NER')
bertner = BertForTokenClassification.from_pretrained('tartuNLP/EstBERT_NER')
nlp = pipeline("ner", model=bertner, tokenizer=tokenizer)
sentence = 'Eesti Ekspressi teada on Eesti Pank uurinud Hansapanga tehinguid , mis toimusid kaks aastat tagasi suvel ja mille käigus voolas panka ligi miljardi krooni ulatuses kahtlast raha .'
ner_results = nlp(sentence)
print(ner_results)
輸出示例
[{'word': 'Eesti', 'score': 0.9964128136634827, 'entity': 'B-ORG', 'index': 1}, {'word': 'Ekspressi', 'score': 0.9978809356689453, 'entity': 'I-ORG', 'index': 2}, {'word': 'Eesti', 'score': 0.9988121390342712, 'entity': 'B-ORG', 'index': 5}, {'word': 'Pank', 'score': 0.9985784292221069, 'entity': 'I-ORG', 'index': 6}, {'word': 'Hansapanga', 'score': 0.9979034662246704, 'entity': 'B-ORG', 'index': 8}]
✨ 主要特性
EstBERT_NER是一個經過微調的EstBERT模型,可用於命名實體識別。該模型在由Tkachenko等人創建的愛沙尼亞語NER數據集上進行訓練,能夠識別三種類型的實體:地點(LOC)、組織(ORG)和人物(PER)。
📚 詳細文檔
BibTeX引用和引用信息
@misc{tanvir2020estbert,
title={EstBERT: A Pretrained Language-Specific BERT for Estonian},
author={Hasan Tanvir and Claudia Kittask and Kairit Sirts},
year={2020},
eprint={2011.04784},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
📄 許可證
本項目採用CC BY 4.0許可證。
屬性 |
詳情 |
基礎模型 |
tartuNLP/EstBERT |
許可證 |
CC BY 4.0 |