GLM-Edge-V-5B開源多模態模型 - 支持圖文本輸入，執行理解與生成任務

首頁

Glm Edge V 5b

由THUDM開發

GLM-Edge-V-5B是一個50億參數的多模態模型，支持圖像和文本輸入，能夠執行圖像理解和文本生成任務。

圖像生成文本

Safetensors

開源協議:其他 #圖像文本描述 #多模態對話 #中文優化

下載量 4,357

發布時間 : 11/24/2024

模型概述

該模型是一個基於GLM架構的多模態模型，能夠處理圖像和文本輸入，生成相關的文本輸出。適用於圖像描述、視覺問答等任務。

模型特點

多模態處理能力

能夠同時處理圖像和文本輸入，生成相關的文本輸出。

大模型架構

基於GLM架構，擁有50億參數，具備強大的理解和生成能力。

中文支持

針對中文場景優化，能夠更好地理解和生成中文文本。

模型能力

圖像理解

文本生成

圖像描述

視覺問答

使用案例

圖像理解

圖像描述

輸入一張圖片，模型能夠生成描述圖片內容的文本。

生成準確、流暢的圖片描述文本。

視覺問答

輸入一張圖片和相關問題，模型能夠生成回答。

生成與圖片內容相關的準確回答。

屬性	詳情
模型類型	image-text-to-text
訓練框架	Pytorch
許可證	other（glm-4）
許可證鏈接	LICENSE

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Glm Edge V 5b

模型概述

模型特點

模型能力

使用案例

🚀 GLM-Edge-V-5B

🚀 快速開始

✨ 主要特性

📦 安裝指南

💻 使用示例

基礎用法

📄 許可證

信息表格