F

Fintor GUI S2

Fintorによって開発
Fintor-GUI-S2はUI-TARS-7B-DPOを微調整したGUI基礎モデルで、グラフィカルユーザーインターフェース(GUI)のマルチモーダルタスクに特化しています。
ダウンロード数 190
リリース時間 : 3/12/2025

モデル概要

このモデルはグラフィカルユーザーインターフェース(GUI)に最適化されたマルチモーダルモデルで、GUI関連のテキストや画像コンテンツを理解し生成できます。

モデル特徴

GUI最適化
グラフィカルユーザーインターフェースタスクに特化して微調整されており、GUI関連タスクで優れた性能を発揮します。
マルチモーダル能力
画像とテキスト情報を同時に処理し、クロスモーダルな理解と生成を実現します。
性能向上
Screenspotベンチマークテストでベースモデルと比べて顕著な性能向上を示しています。

モデル能力

GUI画像理解
クロスモーダルテキスト生成
GUI要素認識
マルチモーダル推論

使用事例

GUI自動化
GUI要素記述生成
GUIスクリーンショットからインターフェース要素の記述テキストを生成
Screenspot v2ベンチマークで91.8の精度を達成
GUI操作ガイド
GUI画像から操作手順の説明を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase