C

Clip Gpt2 Finetuned

由vidi-deshp開發
這是一個針對即時圖像描述生成任務微調的CLIP-GPT2版本,旨在輔助視障人士理解圖像內容。
下載量 18
發布時間 : 3/18/2025

模型概述

該模型結合了CLIP的視覺理解能力和GPT-2的文本生成能力,專門針對圖像描述生成任務進行了微調。

模型特點

輔助視障人士
專門為幫助視障人士理解圖像內容而設計
即時生成
能夠即時生成圖像描述
多模態融合
結合視覺和語言模型的能力

模型能力

圖像理解
文本生成
圖像描述生成

使用案例

無障礙技術
視障輔助應用
為視障人士提供圖像內容的語音描述
幫助視障人士更好地理解周圍環境
內容生成
自動圖像標註
為社交媒體圖片自動生成描述
提高內容可訪問性和搜索引擎優化
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase