llama-3.2-11B-Vision-Medicalオープンソース医療ビジョンモデル - 迅速なチューニングで医療アプリケーションをサポート

ホーム

Llama 3.2 11B Vision Medical

Varu96によって開発

unsloth/Llama-3.2-11B-Vision-Instructを基に微調整されたモデルで、UnslothとHuggingfaceのTRLライブラリを使用してトレーニングされ、速度が2倍向上しました。

テキスト生成画像

Transformers

英語オープンソースライセンス:Apache-2.0 #視覚指示ファインチューニング #効率的なトレーニング加速 #マルチモーダル推論

ダウンロード数 25

リリース時間 : 3/10/2025

モデル概要

これは視覚とテキストの指示を組み合わせたマルチモーダルモデルで、視覚とテキスト入力を処理し、対応するテキスト出力を生成できます。

モデル特徴

効率的なトレーニング

UnslothとHuggingfaceのTRLライブラリを使用してトレーニングされ、速度が2倍向上しました。

マルチモーダルサポート

視覚とテキスト入力を処理し、対応するテキスト出力を生成できます。

オープンソースライセンス

Apache-2.0ライセンスを採用しており、商業および研究用途で利用可能です。

モデル能力

テキスト生成

視覚理解

マルチモーダル推論

使用事例

教育

視覚的質問応答

提供された画像と質問に基づいて、正確な回答を生成します。

学習効率とインタラクティブ性を向上させます。

コンテンツ作成

画像とテキスト生成

画像に基づいて記述的なテキストやストーリーを生成します。

コンテンツ作成の多様性を豊かにします。

属性	详情
ベースモデル	unsloth/Llama-3.2-11B-Vision-Instruct
タグ	text-generation-inference、transformers、unsloth、mllama
ライセンス	apache-2.0
言語	en

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Llama 3.2 11B Vision Medical

モデル概要

モデル特徴

モデル能力

使用事例

🚀 アップロードされたファインチューニング済みモデル

📚 ドキュメント

モデル情報

開発者とライセンス

📄 ライセンス