Swin Base Patch4 Window7 224 20epochs Finetuned Memes
S
Swin Base Patch4 Window7 224 20epochs Finetuned Memes
jayantaによって開発
Swin Transformerアーキテクチャに基づく画像分類モデルで、memesデータセットで20エポックのファインチューニングを行い、検証セットの精度は84.78%を達成
ダウンロード数 13
リリース時間 : 9/17/2022
モデル概要
これはSwin Transformerに基づく視覚モデルで、ネットワークミーム(memes)画像分類タスクに特化して最適化されています。画像分類タスクで優れた性能を発揮し、特にソーシャルメディアの視覚コンテンツ処理に適しています。
モデル特徴
高性能画像分類
memesデータセットで84.78%の精度、F1スコア85.04%を達成
Swin Transformerアーキテクチャ
先進的な階層型ウィンドウアテンションメカニズムを採用し、視覚情報を効果的に処理
軽量ファインチューニング
わずか20エポックのトレーニングで優れた性能を達成、トレーニング効率が高い
モデル能力
画像分類
視覚コンテンツ理解
ミーム認識
使用事例
ソーシャルメディア分析
ミーム分類
ネットワークで流行しているミーム画像を自動識別・分類
精度84.78%
コンテンツモデレーション
不適切コンテンツ識別
不適切な内容を含む可能性のある視覚素材を識別
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98