C

Comprehend It Multilingual T5 Base

由knowledgator開發
基於mT5-base的多語言零樣本分類模型,支持近100種語言的雙向文本分類
下載量 420
發布時間 : 1/26/2024

模型概述

這是一個基於mT5-base的編碼器-解碼器模型,專門用於多語言自然語言推理和文本分類任務。模型能夠理解文本和標籤的上下文含義,支持文本和標籤使用不同語言的零樣本分類。

模型特點

多語言支持
支持近100種語言的零樣本分類,包括中文、英語、西班牙語等主流語言
雙向語言處理
文本和標籤可以使用不同語言,模型仍能準確分類
上下文理解
通過編碼器-解碼器架構分別處理文本和標籤,更好地理解上下文含義
高性能
在多個文本分類數據集上表現優於同類模型

模型能力

多語言文本分類
零樣本學習
自然語言推理
跨語言分類

使用案例

內容分類
新聞分類
將新聞文章自動分類到預定義的類別中
在BBC新聞數據集上表現良好
情感分析
識別文本中的情感傾向
在情感分析數據集上F1分數達0.566
多語言應用
跨語言內容分類
使用英語標籤分類其他語言的文本內容
如使用英語標籤分類烏克蘭語文本
多語言內容管理
為多語言網站或應用提供統一的分類系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase