Reddit Ner Place Names
模型概述
該模型是基於bert-base-uncased微調的命名實體識別模型,使用wnut_17數據集及498條Reddit評論數據訓練,專注於識別社交媒體文本中的地理位置名稱。
模型特點
社交媒體文本優化
針對Reddit等社交媒體文本進行優化,能有效處理非正式表達和俚語
專注地理位置識別
移除了其他實體類型,專注於地理位置名稱的識別
轉喻識別能力
能夠識別並忽略地名轉喻現象(如球隊名稱中的地名)
模型能力
社交媒體文本處理
地理位置實體識別
轉喻現象識別
使用案例
社交媒體分析
用戶地理位置分析
從Reddit等社交媒體評論中提取用戶提到的地理位置信息
可識別非正式表達中的地名,如'brum'代表伯明翰
事件地理關聯分析
分析社交媒體討論中事件與地理位置的關聯
能正確識別轉喻現象中的實際地理位置
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98