B

Bertopic ArXiv

由MaartenGr開發
基於BERTopic框架的預訓練話題建模模型,使用約3萬篇ArXiv論文摘要訓練,支持多維度話題表示和分類
下載量 231
發布時間 : 5/30/2023

模型概述

BERTopic是一個靈活模塊化的話題建模框架,能夠從海量數據中生成易於解釋的話題分類。本模型展示了BERTopic中多種話題表示方法的組合應用。

模型特點

多維度話題表示
結合詞性標註、KeyBERT啟發式、MMR等多種技術生成豐富的話題表示
ChatGPT增強
利用ChatGPT生成話題標籤和摘要,提升可解釋性
模塊化設計
支持靈活組合不同的話題表示和聚類算法

模型能力

文本分類
話題提取
關鍵詞生成
話題摘要生成

使用案例

學術研究
論文主題分析
對ArXiv等學術論文庫進行主題挖掘和分類
識別107個不同主題
內容分析
文檔聚類
對大規模文檔集合進行自動主題聚類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase