S

Smoldocling 256M Preview Mlx Fp16

ahishammによって開発
このモデルはds4sd/SmolDocling-256M-previewからMLX形式に変換された視覚言語モデルで、画像テキストからテキストへのタスクをサポートします。
ダウンロード数 24
リリース時間 : 3/17/2025

モデル概要

SmolDocling-256M-preview-mlx-fp16はMLXフレームワークに基づく視覚言語モデルで、主に画像テキストからテキストへのタスクを処理します。オリジナルモデルds4sd/SmolDocling-256M-previewから変換され、Appleチップ上で効率的に動作するように設計されています。

モデル特徴

MLX形式最適化
このモデルはMLX形式に変換されており、Appleチップ上で効率的に動作するように最適化されています。
視覚言語処理
画像テキストからテキストへのタスクをサポートし、画像に関連するテキスト内容を理解・生成できます。
軽量モデル
パラメータサイズは256Mで、リソースが限られた環境での展開と使用に適しています。

モデル能力

画像テキスト理解
テキスト生成
視覚言語タスク処理

使用事例

ドキュメント処理
画像ドキュメント解析
画像からテキスト情報を抽出し、構造化テキストを生成します。
マルチモーダルアプリケーション
画像説明生成
入力画像に基づいて記述テキストを生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase