H

Heron Preliminary Git Llama 2 70b V0

由turing-motors開發
一個通過圖像-文本對進行預訓練的視覺語言模型,基於Llama-2 70B架構,適用於圖像描述生成任務。
下載量 14
發布時間 : 9/7/2023

模型概述

該模型使用GIT適配器在M3IT Coco Captions數據集上進行訓練,主要用於圖像到文本的轉換任務。

模型特點

視覺語言理解
能夠理解圖像內容並生成相應的文本描述
大模型架構
基於Llama-2 70B大語言模型,具備強大的語言理解能力
GIT適配器
使用GIT(GenerativeImage2Text)架構實現圖像到文本的轉換

模型能力

圖像理解
文本生成
圖像描述生成

使用案例

計算機視覺
圖像自動標註
為圖像自動生成描述性文本
輔助工具
視覺輔助
為視障人士提供圖像內容描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase