INFRL - Qwen2.5 - VL - 72B - Preview Open-source Vision-Language Model Optimizes Inference and Performs Well in Benchmark Tests

INFRL Qwen2.5 VL 72B Preview Bf16.gguf

Developed by GeorgyGUF

A vision-language model optimized based on Qwen2.5-VL-72B-Instruct, excelling in multiple visual reasoning benchmarks

Text-to-Image EnglishOpen Source License:Apache-2.0 #Visual Reasoning Enhancement #Multimodal Math Problem Solving #Reinforcement Learning Optimization

Downloads 40

Release Time : 5/10/2025

Model Overview

The INFRL-Qwen2.5-VL-72B Preview is a vision-language model optimized from Qwen2.5-VL-72B-Instruct, with enhanced visual reasoning capabilities, achieving outstanding performance in benchmarks such as MathVision, MathVista, and MathVerse.

Model Features

Enhanced Visual Reasoning

Specially optimized visual reasoning capabilities based on Qwen2.5-VL-72B-Instruct

Leading in Multiple Benchmarks

Top performance in multiple visual reasoning benchmarks including MathVision, MathVista, and MathVerse

Open-Source Model

As an open-source vision-language model, it outperforms commercial models in various tests

Model Capabilities

Visual Question Answering

Image Understanding

Mathematical Reasoning

Multimodal Understanding

Use Cases

Education

Math Problem Solving

Solving math problems containing diagrams and formulas

Achieved 41.9 points on the MathVision test set

Research

Visual Reasoning Research

Used for evaluating and researching vision-language model capabilities

Achieved 77.8 points on the MathVista test mini-set

Property	Details
Model Type	INFRL-Qwen2.5-VL-72B-Preview
Base Model	Qwen/Qwen2.5-VL-72B-Instruct
Language	English
License	Apache-2.0
Tags	Transformers, Multimodal
Pipeline Tag	Visual Question Answering

Models	MathVision (test)	MathVista (testmini)	MathVerse (testmini)
GPT4o	30.6	60	41.2
Gemini-2.0-Flash	41.3	70.1	50.6
Claude 3.5 Sonnet	33.5	67.7	47.8
QvQ-72B	35.9	71.4	48.6
InternVL2.5-78B	34.9	72.3	51.7
Qwen-VL-2.5-72B	38.1	74.8	57.18
INFRL-VL-Preview	41.9	77.8	58.84

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

INFRL Qwen2.5 VL 72B Preview Bf16.gguf

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 INFRL-Qwen2.5-VL-72B-Preview

📚 Documentation

Model Overview

Evaluation

Contributors

Supervisors

VL Team

RL Team

Thanks

Citation

📄 License