Qwen2-VL-7B-VLGuard開源多模態模型 - 免費部署解決安全視覺問答任務

Home

Qwen2 VL 7B VLGuard

Developed by Foreshhh

基於Qwen2-VL-7B模型在VLGuard數據集上微調的多模態視覺語言模型，專注於安全相關的視覺問答任務。

文本生成圖像

Safetensors

EnglishOpen Source License:Apache-2.0 #多模態安全問答 #視覺語言聯合推理 #7B參數高效微調

Downloads 24

Release Time : 12/16/2024

Model Overview

該模型是一個多模態大語言模型，結合視覺和語言理解能力，專門用於處理安全相關的視覺問答任務。

Model Features

多模態理解

能夠同時處理圖像和文本輸入，理解視覺和語言信息。

安全導向

專門針對安全相關的視覺問答任務進行優化。

大規模預訓練

基於7B參數的大規模預訓練模型，具有強大的泛化能力。

Model Capabilities

視覺問答

圖像理解

文本理解

多模態推理

Use Cases

安全監控

異常行為識別

通過分析監控圖像識別潛在的安全威脅或異常行為。

內容審核

違規內容檢測

識別圖像中可能包含的違規或不適當內容。

屬性	詳情
模型類型	視覺問答模型
基礎模型	Qwen/Qwen2-VL-7B-Instruct
訓練數據	ys-zong/VLGuard
任務標籤	視覺問答
標籤	安全、多模態大語言模型
許可證	Apache-2.0

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Qwen2 VL 7B VLGuard

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Qwen2-VL-7B視覺問答微調模型

📦 模型信息

📚 詳細文檔

📄 許可證