Bertweet Covid19 Base Uncased
BERTweet是首個針對英文推文進行預訓練的大規模公開語言模型,基於RoBERTa架構優化,專門處理社交媒體文本。
下載量 15
發布時間 : 3/2/2022
模型概述
BERTweet是一個預訓練語言模型,專門針對英文推文優化,適用於社交媒體文本分析任務。
模型特點
社交媒體專用
專門針對推文特點進行優化,能更好處理社交媒體文本中的非正式表達、縮寫和話題標籤。
大規模訓練數據
使用8.5億條英文推文(160億詞元)進行預訓練,包含COVID-19相關推文。
RoBERTa優化
基於RoBERTa預訓練方法構建,採用更高效的訓練策略。
模型能力
推文文本理解
社交媒體情感分析
話題分類
命名實體識別
使用案例
社交媒體分析
疫情相關推文分析
分析COVID-19相關推文中的公眾情緒和關注點
品牌輿情監測
監測和分析社交媒體上關於特定品牌的討論
自然語言處理研究
社交媒體語言模型研究
作為基準模型用於社交媒體文本處理相關研究
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98