T

Topicclassifier NoURL

由WebOrganizer開發
基於網頁文本內容(不使用URL信息)將網絡內容劃分為17個類別的分類模型
下載量 41.04k
發布時間 : 2/10/2025

模型概述

該模型是在gte-base-en-v1.5基礎上微調而成,專門用於網頁文本內容的主題分類,支持17個類別。

模型特點

無URL依賴
僅依賴網頁文本內容進行分類,不依賴URL信息
多階段訓練
使用Llama-3.1-8B和Llama-3.1-405B-FP8標註的數據進行兩階段訓練
高效推理
支持去填充和內存高效注意力機制以提升運行效率

模型能力

網頁文本分類
多類別概率分佈輸出

使用案例

內容管理
網頁內容分類
對網頁內容進行自動分類,便於內容管理和組織
輸出17個類別的概率分佈
信息過濾
成人內容過濾
識別並過濾成人內容
可識別成人內容類別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase