D

Dolphin Vision 72b

dphnによって開発
DolphinVision 72bはマルチモーダルモデルで、他の人気モデルが処理を拒否する画像に対して推論とコメントを行うことができます。
ダウンロード数 296
リリース時間 : 6/28/2024

モデル概要

DolphinVision 72bは無審査のマルチモーダルモデルで、Quan Nguyen、Eric Hartford、Cognitive Computationsによって慎重に企画され、訓練されたもので、画像とテキストのマルチモーダルタスクを処理することができます。

モデル特徴

マルチモーダル能力
画像とテキストを同時に処理し、複雑なマルチモーダル推論を行うことができます。
無審査
他の人気モデルが処理を拒否する画像に対して推論とコメントを行うことができます。
高性能
複数のベンチマークテストで優れた成績を収め、GPT - 4Vの性能に近い、またはそれを上回っています。

モデル能力

画像記述
テキスト生成
OCR認識
マルチモーダル推論

使用事例

画像分析
OCRテキスト認識
画像からテキスト内容を抽出して認識します。
画像内の皮肉なテキスト内容を正確に認識します。
コンテンツ生成
画像記述生成
画像に基づいて詳細な記述テキストを生成します。
正確で詳細な画像記述を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase