Llama 3.2 Vision Instruct Bpmncoder
L
Llama 3.2 Vision Instruct Bpmncoder
Developed by utkarshkingh
Unslothで最適化されたLlama 3.2 11B視覚命令ファインチューニングモデル、4ビット量子化技術を採用、トレーニング速度が2倍向上
Downloads 40
Release Time : 3/23/2025
Model Overview
これはファインチューニングされたマルチモーダル言語モデルで、視覚とテキストの命令理解と生成をサポートし、マルチモーダルインタラクションシナリオに適しています
Model Features
効率的なトレーニング最適化
Unslothフレームワークを使用して最適化、トレーニング速度が2倍向上
4ビット量子化技術
BNB 4ビット量子化を採用、VRAM要件を低減
マルチモーダルサポート
視覚とテキストの命令理解と生成をサポート
Model Capabilities
マルチモーダル命令理解
テキスト生成
視覚コンテンツ分析
推論タスク処理
Use Cases
インテリジェントアシスタント
マルチモーダルダイアログシステム
画像とテキストを含む複雑なユーザークエリを処理
視覚とテキスト情報を組み合わせた総合的な回答を提供
コンテンツ生成
画像とテキストのコンテンツ作成
視覚入力に基づいて関連するテキスト記述を生成
高品質な画像とテキストのマッチングコンテンツを自動生成
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98