I

Internvl3 38B Instruct GGUF

由unsloth開發
InternVL3-38B-Instruct 是一個先進的多模態大語言模型(MLLM),展示了卓越的整體性能,具備強大的多模態感知和推理能力。
下載量 1,236
發布時間 : 5/19/2025

模型概述

InternVL3-38B-Instruct 是 InternVL3 系列的 SFT 版本,經過原生多模態預訓練和監督微調,支持多模態任務如圖像文本理解、工具使用、GUI 代理、工業圖像分析等。

模型特點

原生多模態預訓練
將語言和視覺學習整合到一個預訓練階段,增強多模態表示能力。
可變視覺位置編碼(V2PE)
使用更小、更靈活的位置增量處理視覺標記,提升長上下文理解能力。
混合偏好優化(MPO)
通過正負樣本監督對齊模型響應分佈,提升推理性能。
動態分辨率支持
支持多圖像和視頻數據,動態處理不同分辨率的輸入。

模型能力

多模態文本生成
圖像理解
視頻理解
工具使用
GUI 代理
工業圖像分析
3D 視覺感知
多語言支持

使用案例

多模態推理
圖像描述生成
根據輸入圖像生成詳細描述。
生成高質量的圖像描述,支持多輪對話。
視頻理解
分析視頻內容並生成描述。
支持多幀視頻分析,生成連貫的視頻描述。
工具使用
GUI 操作
根據 GUI 截圖生成操作指令。
生成準確的 GUI 操作步驟。
工業應用
工業圖像分析
分析工業場景中的圖像數據。
支持複雜的工業圖像理解任務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase