M

Multilingual IPTC News Topic Classifier

由classla開發
基於xlm-roberta-large的多語言新聞主題分類模型,支持17個IPTC媒體主題標籤分類
下載量 78.56k
發布時間 : 8/8/2024

模型概述

該模型用於對新聞文本進行IPTC媒體主題分類,支持多種語言,適用於新聞行業的內容分類和標籤化。

模型特點

多語言支持
支持xlm-roberta-large支持的所有語言,包括但不限於克羅地亞語、斯洛文尼亞語、加泰羅尼亞語和希臘語
IPTC標準分類
使用IPTC媒體主題新聞代碼體系的17個頂級標籤進行分類
高性能
在手動標註測試集上,宏觀F1得分為0.746,微觀F1得分為0.734,準確率為0.734,優於零樣本設置的GPT-4o模型
高置信度篩選
當僅使用置信度分數≥0.90的標籤時,模型的微觀F1和宏觀F1可達0.80

模型能力

多語言文本分類
新聞主題識別
IPTC標準標籤應用

使用案例

新聞行業
新聞內容分類
對新聞文章進行自動主題分類,便於內容管理和檢索
準確率達到0.734,優於GPT-4o零樣本設置
新聞聚合
根據主題對多語言新聞進行聚合和組織
內容管理
內容標籤化
為新聞內容自動添加IPTC標準標籤
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase