Vit Base Patch16 224 In21k Writer Identification
GoogleのViTモデルをファインチューニングした筆跡認識タスク用モデル
ダウンロード数 21
リリース時間 : 9/7/2022
モデル概要
このモデルはGoogleのViT(Vision Transformer)ベースモデルを筆跡認識タスク向けにファインチューニングしたバージョンで、異なる著者の筆跡スタイルを識別できます。
モデル特徴
Transformerベースの視覚モデル
Vision Transformerアーキテクチャを使用して画像データを処理し、強力な特徴抽出能力を備えています
筆跡認識能力
筆跡認識タスク向けに特別にファインチューニングされており、異なる著者の筆跡スタイルを区別できます
転移学習
事前学習済みViTモデルを基にファインチューニングしており、大規模画像事前学習の利点を活用しています
モデル能力
筆跡特徴抽出
著者識別
画像分類
使用事例
文書分析
歴史的文書の著者識別
歴史的文書や写本の可能性のある著者を識別
検証セット精度42.55%、Top-3精度68.84%
筆跡検証
2つの文書が同一著者によって書かれたかどうかを検証
セキュリティ検証
署名検証
署名の真正性を検証
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98