C

CT M1 Complete SE

由crisistransformers開發
CrisisTransformers是面向危機相關社交媒體文本的預訓練語言模型與句子編碼器系列,基於RoBERTa架構,在150億詞標記的危機事件數據集上訓練。
下載量 60
發布時間 : 9/11/2023

模型概述

單語種(英語)句子編碼器,可直接用於生成句子嵌入,支持語義搜索、聚類、主題建模等任務。

模型特點

危機文本優化
專門針對危機相關社交媒體文本訓練,在疾病暴發、自然災害等30多類危機事件數據上表現優異。
性能提升
在18個公開危機數據集上測試,最佳單語種編碼器性能較現有技術提升超過17%。
即用型編碼器
無需微調即可直接用於句子嵌入生成,支持下游應用快速部署。

模型能力

句子嵌入生成
語義相似度計算
文本聚類
主題建模

使用案例

危機響應
災害信息分類
對災害相關推文進行自動分類,識別求助、報告等信息類型。
在基準測試中分類準確率優於通用模型
多語言危機監測
通過多語言編碼器實現跨語言危機信息監測與分析。
社交媒體分析
事件主題發現
從危機事件相關推文中自動發現和聚類關鍵主題。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase