I

Internvl3 8B Instruct GGUF

由unsloth開發
InternVL3-8B-Instruct 是一個先進的多模態大語言模型(MLLM),展示了卓越的整體性能,具備強大的多模態感知和推理能力。
下載量 2,412
發布時間 : 5/19/2025

模型概述

InternVL3-8B-Instruct 是 InternVL3 系列的 SFT 版本,經過了原生多模態預訓練和 SFT,但未經過 MPO。該模型支持多模態任務,包括工具使用、GUI 代理、工業圖像分析、3D 視覺感知等。

模型特點

原生多模態預訓練
將語言和視覺學習整合到一個預訓練階段,增強模型的多模態處理能力。
可變視覺位置編碼(V2PE)
使用更小、更靈活的位置增量處理視覺標記,提升長上下文理解能力。
多模態能力擴展
支持工具使用、GUI 代理、工業圖像分析、3D 視覺感知等多種任務。
高性能推理
在多項基準測試中表現出卓越的多模態推理和數學能力。

模型能力

多模態推理
OCR
圖表和文檔理解
多圖像和真實世界理解
視覺定位
多模態多語言理解
視頻理解
GUI 定位
空間推理

使用案例

工業應用
工業圖像分析
用於分析工業場景中的圖像,識別缺陷或異常。
教育
科學圖表理解
幫助學生理解和分析科學圖表中的信息。
娛樂
視頻內容理解
分析視頻內容,生成描述或回答相關問題。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase