F

Florence 2 Base Castollux V0.4

PJMixers-Imagesによって開発
microsoft/Florence-2-baseをファインチューニングした画像キャプション生成モデルで、記述品質とフォーマットの向上に焦点
ダウンロード数 23
リリース時間 : 2/4/2025

モデル概要

このモデルはFlorence-2-baseアーキテクチャをファインチューニングした画像からテキストへのモデルで、画像キャプション生成の品質とフォーマットを特別に最適化しています。<CAPTION>タスクプロンプトを使用してトレーニングされ、詳細で正確な画像キャプション生成に適しています。

モデル特徴

高品質画像キャプション
詳細で正確な画像キャプションを生成し、ベースモデルを上回る性能
フォーマット最適化
キャプションのフォーマットと構造を特別に最適化
タスクプロンプト対応
<CAPTION>タスクプロンプトをサポートし、他のプロンプトタイプにも拡張可能

モデル能力

画像キャプション生成
詳細シーン分析
物体認識と記述

使用事例

コンテンツ生成
自動画像キャプション
画像に対して詳細な記述テキストを生成
ベースモデルよりも正確で詳細な記述を生成
アクセシビリティ支援
視覚障害者向けに画像内容を記述
より包括的なシーン理解を提供
メディア処理
メディアコンテンツ分析
画像内容を自動分析して記述生成
コンテンツ分類と検索に利用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase