Q

Qwen2 VL 7B VLGuard

由Foreshhh開發
基於Qwen2-VL-7B模型在VLGuard數據集上微調的多模態視覺語言模型,專注於安全相關的視覺問答任務。
下載量 24
發布時間 : 12/16/2024

模型概述

該模型是一個多模態大語言模型,結合視覺和語言理解能力,專門用於處理安全相關的視覺問答任務。

模型特點

多模態理解
能夠同時處理圖像和文本輸入,理解視覺和語言信息。
安全導向
專門針對安全相關的視覺問答任務進行優化。
大規模預訓練
基於7B參數的大規模預訓練模型,具有強大的泛化能力。

模型能力

視覺問答
圖像理解
文本理解
多模態推理

使用案例

安全監控
異常行為識別
通過分析監控圖像識別潛在的安全威脅或異常行為。
內容審核
違規內容檢測
識別圖像中可能包含的違規或不適當內容。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase