D

Doubutsu 2b Pt 756

qresearchによって開発
doubutsuはカスタマイズシナリオの微調整のために設計された軽量視覚言語モデルシリーズです。
ダウンロード数 129
リリース時間 : 7/22/2024

モデル概要

このモデルは視覚言語モデルで、画像に基づいてテキスト記述を生成でき、画像からテキスト生成タスクに適しています。

モデル特徴

軽量設計
カスタマイズシナリオの微調整のために特別に設計されており、軽量アプリケーションに適しています。
視覚言語モデル
画像とテキスト情報を組み合わせて、関連するテキスト記述を生成できます。
微調整が必要
モデルは単独で使用できず、微調整または既存アダプターの使用が必要です。

モデル能力

画像キャプション生成
視覚的質問応答
画像とテキストの組み合わせタスク

使用事例

画像理解
画像キャプション生成
入力画像に基づいて詳細なテキスト記述を生成します。
視覚的質問応答
画像内容に関する特定の質問に答えます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase