S

Swin Base Patch4 Window7 224 20epochs Finetuned Memes

由jayanta開發
基於Swin Transformer架構的圖像分類模型,在memes數據集上微調20輪,驗證集準確率達84.78%
下載量 13
發布時間 : 9/17/2022

模型概述

這是一個基於Swin Transformer的視覺模型,專門針對網絡表情包(memes)圖像分類任務進行了優化。模型在圖像分類任務上表現出色,特別適合處理社交媒體中的視覺內容。

模型特點

高性能圖像分類
在memes數據集上達到84.78%的準確率,F1分數85.04%
Swin Transformer架構
採用先進的層次化窗口注意力機制,有效處理視覺信息
輕量級微調
僅需20輪訓練即可達到優異性能,訓練效率高

模型能力

圖像分類
視覺內容理解
表情包識別

使用案例

社交媒體分析
表情包分類
自動識別和分類網絡流行的表情包圖像
準確率84.78%
內容審核
不當內容識別
識別可能包含不當內容的視覺素材
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase