L

Llama 3.2 11B Vision Instruct Nf4

Developed by SeanScripts
meta-llama/Llama-3.2-11B-Vision-Instructを基にした4ビット量子化バージョンで、画像理解とテキスト生成タスクをサポート
Downloads 658
Release Time : 9/25/2024

Model Overview

これはマルチモーダルモデルで、画像内容を理解し関連するテキスト記述を生成できます。NF4量子化技術によりモデルサイズを縮小し、リソースが限られた環境での展開に適しています。

Model Features

4ビット量子化技術
NF4量子化技術を使用してモデルを4ビット精度に圧縮し、メモリ使用量を大幅に削減
マルチモーダル理解
画像とテキスト入力を同時に処理し、画像内容を理解して関連する記述を生成可能
効率的な推論
量子化されたモデルは良好な性能を維持しながら推論速度を向上

Model Capabilities

画像内容理解
画像キャプション生成
マルチモーダル対話
視覚的質問応答

Use Cases

コンテンツ生成
自動画像タグ付け
画像に対して記述的なテキストを生成し、コンテンツ管理システムに利用可能
正確で流暢な画像記述を生成
支援ツール
視覚障害者支援
画像内容を音声記述に変換
視覚障害者が視覚コンテンツを理解するのを支援
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase