S

Sharecaptioner

由Lin-Chen開發
ShareCaptioner是一個開源的圖像描述生成模型,基於改進的InternLM-Xcomposer-7B基礎模型,在GPT4-Vision輔助的ShareGPT4V數據集上微調,能生成高質量的圖像描述。
下載量 401
發布時間 : 12/13/2023

模型概述

ShareCaptioner是一個專注於生成高質量圖像描述的開源模型,為計算機視覺和自然語言處理領域提供支持。

模型特點

高質量圖像描述
能夠生成詳細、準確的圖像描述,質量接近GPT4-Vision水平
448x448高分辨率支持
支持處理448x448分辨率的圖像輸入
開源可微調
模型完全開源,支持用戶進一步微調以適應特定需求

模型能力

圖像理解
自然語言生成
多模態處理

使用案例

計算機視覺
圖像自動標註
為圖像數據集生成詳細的描述性標籤
提高數據集標註效率和質量
輔助技術
視覺障礙輔助
為視覺障礙用戶提供圖像內容描述
增強無障礙訪問體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase