C

Cogvlm Chat Hf

Developed by THUDM
CogVLM是一个强大的开源视觉语言模型,在多个跨模态基准测试中取得领先性能
Downloads 4,816
Release Time : 11/16/2023

Model Overview

CogVLM是一个视觉语言模型(VLM),结合了视觉和语言处理能力,适用于多模态任务

Model Features

多模态融合
结合视觉和语言处理能力,实现跨模态理解
高性能
在10个经典跨模态基准测试中取得领先性能
视觉专家模块
独特的视觉专家模块增强视觉理解能力

Model Capabilities

图像描述生成
视觉问答
跨模态理解
多模态对话

Use Cases

图像理解
图像描述生成
为图像生成准确的自然语言描述
在Flicker30k字幕生成任务中表现优异
视觉问答
基于图像的问答
回答关于图像内容的自然语言问题
在VQAv2、OKVQA等任务中位列第二
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase