S

Smoldocling 256M Preview Mlx Fp16

Developed by ahishamm
该模型是从 ds4sd/SmolDocling-256M-preview 转换为 MLX 格式的视觉语言模型,支持图像文本到文本任务。
Downloads 24
Release Time : 3/17/2025

Model Overview

SmolDocling-256M-preview-mlx-fp16 是一个基于 MLX 框架的视觉语言模型,主要用于处理图像文本到文本的任务。它是从原始模型 ds4sd/SmolDocling-256M-preview 转换而来,适用于在苹果芯片上高效运行。

Model Features

MLX 格式优化
该模型已转换为 MLX 格式,特别适合在苹果芯片上高效运行。
视觉语言处理
支持图像文本到文本的任务,能够理解和生成与图像相关的文本内容。
轻量级模型
参数规模为 256M,适合在资源有限的环境中部署和使用。

Model Capabilities

图像文本理解
文本生成
视觉语言任务处理

Use Cases

文档处理
图像文档解析
从图像中提取文本信息并生成结构化文本。
多模态应用
图像描述生成
根据输入图像生成描述性文本。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase