S

Saved Model Git Base

由holipori開發
基於microsoft/git-base在圖像文件夾數據集上微調的視覺語言模型,主要用於圖像描述生成任務
下載量 13
發布時間 : 5/22/2023

模型概述

該模型是基於GIT架構的視覺語言模型,經過微調後能夠根據輸入圖像生成相關文本描述。在評估中表現出良好的文本生成能力。

模型特點

多模態理解能力
能夠同時處理視覺和語言信息,理解圖像內容並生成相關描述
微調優化
在特定圖像數據集上進行微調,提升了在目標領域的表現
評估指標全面
使用多種文本生成評估指標(Rouge, Bleu, Meteor等)進行綜合評估

模型能力

圖像理解
文本生成
多模態處理
圖像描述生成

使用案例

輔助技術
視覺輔助描述
為視障人士生成圖像內容的文字描述
內容創作
社交媒體內容生成
自動為上傳的圖片生成描述文字
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase