T

Twitter Roberta Base Dec2021 Tweetner7 Continuous

由tner開發
該模型是基於RoBERTa架構的Twitter專用命名實體識別模型,在tweetner7數據集上持續微調,用於識別推文中的命名實體。
下載量 20
發布時間 : 7/3/2022

模型概述

該模型專門用於識別Twitter推文中的命名實體,包括人物、地點、組織等類別。通過連續微調優化了在社交媒體文本上的表現。

模型特點

Twitter文本優化
專門針對Twitter文本特點進行優化,能有效處理社交媒體特有的表達方式和格式
連續微調策略
採用先在2020年數據上微調,再在2021年數據上持續微調的兩階段訓練策略
多類別實體識別
能識別7類實體:公司、創意作品、事件、團體、地點、人物和產品

模型能力

Twitter文本命名實體識別
社交媒體文本處理
多類別實體分類

使用案例

社交媒體分析
推文實體提取
從Twitter推文中提取人物、地點、組織等實體信息
F1分數達到0.65
社交媒體監控
監測社交媒體中特定實體(如品牌、名人)的提及情況
數據標註
自動標註工具
為社交媒體文本分析提供預標註服務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase