Diagram Detr R50 Finetuned
このモデルはDETRアーキテクチャに基づく物体検出モデルで、bpmn-shapesデータセットでファインチューニングされており、図表要素の検出タスクに適しています。
ダウンロード数 26
リリース時間 : 1/19/2024
モデル概要
DETRアーキテクチャに基づく視覚的物体検出モデルで、特にBPMN図表の形状要素に最適化されています。
モデル特徴
Transformerベースの検出アーキテクチャ
DETRアーキテクチャを採用し、TransformerとCNNの利点を組み合わせ、エンドツーエンドの物体検出を実現
図表要素への最適化
bpmn-shapesデータセットで特別にファインチューニングされており、図表中の様々な形状要素の検出に適しています
効率的なトレーニングプロセス
混合精度トレーニングと線形学習率スケジューラを使用し、トレーニング効率を最適化
モデル能力
図表要素検出
物体位置特定
形状認識
使用事例
ビジネスプロセスモデリング
BPMN図表分析
BPMN図表中の様々なプロセス要素を自動検出・認識
検証損失0.9817
ドキュメント処理
技術文書解析
技術文書から図表やグラフィック要素を抽出
おすすめAIモデル
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-itの量子化バージョンで、多言語画像記述タスクをサポートします。
画像生成テキスト
Transformers 複数言語対応

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
その他
Colossus Project FluxのNunchaku量子化バージョンで、テキストプロンプトに基づいて高品質な画像を生成することを目的としています。このモデルは、推論効率を最適化しながら、性能損失を最小限に抑えます。
画像生成 英語
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
これはQwen2.5-VL-7Bモデルに基づく静的量子化バージョンで、画像記述生成タスクに特化し、複数の言語をサポートしています。
画像生成テキスト
Transformers 複数言語対応

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8は、Qwen2.5-VL-7B-Instructモデルをベースに、olmOCR-mix-0225データセットで微調整した後、FP8バージョンに量子化した文書OCRモデルです。
画像生成テキスト
Transformers 英語

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128kはQwen3 - 1.7Bをベースに開発された、プロキシ型ネットワーク検索と軽量ブラウジングに特化したモデルで、モバイルデバイスでも効率的に動作します。
大規模言語モデル
Transformers 英語

L
Mungert
263
2