ShareCaptioner開源圖像描述生成模型 - 免費部署產出高質量圖像描述

Sharecaptioner

由Lin-Chen開發

ShareCaptioner是一個開源的圖像描述生成模型，基於改進的InternLM-Xcomposer-7B基礎模型，在GPT4-Vision輔助的ShareGPT4V數據集上微調，能生成高質量的圖像描述。

下載量 401

發布時間 : 12/13/2023

模型概述

ShareCaptioner是一個專注於生成高質量圖像描述的開源模型，為計算機視覺和自然語言處理領域提供支持。

高質量圖像描述

能夠生成詳細、準確的圖像描述，質量接近GPT4-Vision水平

448x448高分辨率支持

支持處理448x448分辨率的圖像輸入

開源可微調

模型完全開源，支持用戶進一步微調以適應特定需求

圖像理解

自然語言生成

多模態處理

計算機視覺

圖像自動標註

為圖像數據集生成詳細的描述性標籤

提高數據集標註效率和質量

輔助技術

視覺障礙輔助

為視覺障礙用戶提供圖像內容描述

增強無障礙訪問體驗

屬性	詳情
模型類型	ShareCaptioner是一個開源的描述生成器，它在GPT4-Vision輔助的ShareGPT4V詳細描述數據上進行了微調，分辨率為448x448。ShareCaptioner基於改進的InternLM-Xcomposer-7B基礎模型。
模型日期	ShareCaptioner於2023年11月進行訓練。
更多信息的論文或資源	[項目] [論文] [代碼]