T

Tvl Mini 0.1

2Vasabiによって開発
これはロシア語対応のQwen2-VL-2BモデルにLORA微調整を施したバージョンで、マルチモーダルタスクをサポートします。
ダウンロード数 23
リリース時間 : 9/13/2024

モデル概要

このモデルはQwen2-VL-2B-Instructを基にLORA微調整を施したロシア語マルチモーダルモデルで、主にテキスト生成タスクに使用され、視覚的推論、画像説明、視覚的質問応答など様々なマルチモーダルタスクをサポートします。

モデル特徴

多言語サポート
特にロシア語に最適化されつつ、英語能力も保持
マルチモーダル能力
画像とテキストの統合処理をサポートし、視覚的推論や質問応答が可能
効率的な微調整
LORA技術を使用してベースモデルを効率的に微調整

モデル能力

テキスト生成
視覚的推論
画像説明
視覚的質問応答
マルチモーダル対話

使用事例

コンテンツ生成
画像キャプション生成
入力画像に基づいて詳細な文章説明を生成
画像の主要な内容とシーンを正確に説明可能
インテリジェントQA
視覚的質問応答
画像内容に関する様々な質問に回答
画像内容を理解し関連する回答を提供可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase