R

Roberta Large Ner English

由Jean-Baptiste開發
基於RoBERTa-large微調的英語命名實體識別模型,在conll2003數據集上訓練,特別優化了電子郵件/聊天數據的實體識別能力。
下載量 236.85k
發布時間 : 3/2/2022

模型概述

該模型專注於英語命名實體識別任務,尤其擅長處理非正式文本(如郵件/聊天)中的實體識別,對非首字母大寫的實體識別效果更佳。

模型特點

優化的非正式文本處理
在電子郵件和聊天數據上驗證,表現優於其他模型,特別適合處理非正式文本。
非首字母大寫實體識別
對非首字母大寫的實體識別效果顯著優於其他模型。
簡化的標籤體系
移除了B-和I-前綴,使用簡化的PER/ORG/LOC/MISC/O五類標籤體系。

模型能力

英語命名實體識別
非正式文本處理
多類別實體分類

使用案例

文本分析
電子郵件簽名檢測
識別電子郵件中的簽名部分和包含的人名、職位等信息
可用於訓練LSTM模型進行簽名檢測(參考提供的Medium文章)
聊天記錄分析
從即時通訊或聊天記錄中提取人名、組織名和地點等信息
在私有數據集上PER實體F1值達0.8967
信息提取
新聞文本分析
從新聞文章中提取人名、組織名和地點等關鍵信息
在conll2003驗證集上綜合F1值達0.9753
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase