Smoldocling 256M Preview Mlx Fp16
该模型是从 ds4sd/SmolDocling-256M-preview 转换为 MLX 格式的视觉语言模型,支持图像文本到文本任务。
Downloads 24
Release Time : 3/17/2025
Model Overview
SmolDocling-256M-preview-mlx-fp16 是一个基于 MLX 框架的视觉语言模型,主要用于处理图像文本到文本的任务。它是从原始模型 ds4sd/SmolDocling-256M-preview 转换而来,适用于在苹果芯片上高效运行。
Model Features
MLX 格式优化
该模型已转换为 MLX 格式,特别适合在苹果芯片上高效运行。
视觉语言处理
支持图像文本到文本的任务,能够理解和生成与图像相关的文本内容。
轻量级模型
参数规模为 256M,适合在资源有限的环境中部署和使用。
Model Capabilities
图像文本理解
文本生成
视觉语言任务处理
Use Cases
文档处理
图像文档解析
从图像中提取文本信息并生成结构化文本。
多模态应用
图像描述生成
根据输入图像生成描述性文本。
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98