SmolDocling-256M-preview-mlx-fp16开源视觉语言模型

Home

Smoldocling 256M Preview Mlx Fp16

Developed by ahishamm

该模型是从 ds4sd/SmolDocling-256M-preview 转换为 MLX 格式的视觉语言模型，支持图像文本到文本任务。

图像生成文本

Transformers

EnglishOpen Source License:Apache-2.0 #MLX优化 #图像文本生成 #轻量级模型

Downloads 24

Release Time : 3/17/2025

Model Overview

SmolDocling-256M-preview-mlx-fp16 是一个基于 MLX 框架的视觉语言模型，主要用于处理图像文本到文本的任务。它是从原始模型 ds4sd/SmolDocling-256M-preview 转换而来，适用于在苹果芯片上高效运行。

Model Features

MLX 格式优化

该模型已转换为 MLX 格式，特别适合在苹果芯片上高效运行。

视觉语言处理

支持图像文本到文本的任务，能够理解和生成与图像相关的文本内容。

轻量级模型

参数规模为 256M，适合在资源有限的环境中部署和使用。

Model Capabilities

图像文本理解

文本生成

视觉语言任务处理

Use Cases

文档处理

图像文档解析

从图像中提取文本信息并生成结构化文本。

多模态应用

图像描述生成

根据输入图像生成描述性文本。

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Smoldocling 256M Preview Mlx Fp16

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 ahishamm/SmolDocling-256M-preview-mlx-fp16

🚀 快速开始

📦 安装指南

💻 使用示例

基础用法

📄 许可证