S

Sd3 Long Captioner

gokaygokayによって開発
PaliGemma 224x224をgoogle/docciとgoogle/imageinwordsデータセットで微調整したバージョンで、画像テキストからテキストへの変換に使用されます。
ダウンロード数 1,771
リリース時間 : 6/13/2024

モデル概要

このモデルはPaliGemma 224x224の微調整バージョンで、画像からテキストへの変換タスクに特化しており、芸術などの分野の応用に特に適しています。

モデル特徴

画像テキスト変換
画像の内容を記述的なテキストに変換することができます。
芸術分野の応用
芸術作品の記述生成に特に適しています。
微調整最適化
特定のデータセットで微調整され、性能が向上しています。

モデル能力

画像理解
テキスト生成
画像記述生成

使用事例

芸術
芸術作品の記述生成
芸術作品に対して自動的に詳細な記述を生成します。
画像の内容を正確に反映したテキスト記述を生成します。
コンテンツ作成
画像内容の記述
画像に対して自動的に記述的なテキストを生成します。
画像の内容に合った詳細な記述を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase