D

Dit Base Finetuned Rvlcdip Finetuned Data200

由AthiraVr開發
該模型是基於microsoft/dit-base-finetuned-rvlcdip在圖像文件夾數據集上微調的版本,主要用於圖像分類任務。
下載量 16
發布時間 : 2/27/2023

模型概述

這是一個經過微調的圖像分類模型,基於DiT(Document Image Transformer)架構,在文檔圖像分類任務上進行了優化。

模型特點

文檔圖像優化
專門針對文檔圖像分類任務進行了優化
遷移學習
基於預訓練的DiT模型進行微調
200輪訓練
經過200輪訓練,達到相對穩定的性能

模型能力

文檔圖像分類
圖像特徵提取

使用案例

文檔處理
文檔類型識別
自動識別不同類型的文檔(如發票、合同、表格等)
在評估集上達到56.99%的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase