L

Llama 3.2 11B Vision Radiology Mini

mervinpraisonによって開発
Unslothで最適化された視覚指示ファインチューニングモデル、マルチモーダルタスク処理をサポート
ダウンロード数 39
リリース時間 : 11/22/2024

モデル概要

これは4ビット量子化で最適化された11Bパラメータ規模のマルチモーダル大規模言語モデルで、視覚とテキストの指示入力をサポートし、マルチモーダル理解と生成タスクに適しています。

モデル特徴

効率的なトレーニング最適化
Unslothフレームワークを使用したトレーニングで、速度が2倍向上
マルチモーダルサポート
視覚とテキスト入力を同時に処理し、クロスモーダル理解を実現
量子化最適化
4ビット量子化バージョンで、ハードウェア要件を低減

モデル能力

視覚的質問応答
画像説明生成
マルチモーダル指示追従
クロスモーダル推論
テキスト生成

使用事例

教育
教材内容理解
教材中の図文内容を解析し、学習指導を生成
学習効率向上、理解深度の強化
カスタマーサービス
マルチモーダルカスタマーサポートアシスタント
顧客がアップロードした画像とテキスト相談を処理
より正確なソリューションを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase