Y

Yi VL 6B Hf

BUAADreamerによって開発
Yi-VL-6Bは01-AIによって開発されたマルチモーダル視覚言語モデルで、中国語と英語をサポートし、視覚質問応答などのタスクに適しています。
ダウンロード数 55
リリース時間 : 5/14/2024

モデル概要

Yi-VL-6BはYiシリーズに基づくマルチモーダル視覚言語モデルで、画像とテキストの共同タスク(視覚質問応答、画像キャプション生成など)を処理できます。

モデル特徴

マルチモーダル能力
画像とテキスト入力を同時に処理し、視覚と言語の共同理解を実現します。
効率的なファインチューニングサポート
LLaMA-Factoryツールキットを使用した効率的なファインチューニングを推奨し、下流タスクへの適応を容易にします。
中英二言語対応
中国語と英語の視覚言語タスク処理をネイティブにサポートします。

モデル能力

視覚質問応答
画像理解
マルチモーダル推論

使用事例

教育
視覚質問応答による学習支援
学生が画像を通じて質問し、関連知識の説明を得るのを支援します
コンテンツ理解
画像内容の説明生成
画像に対して自動的にテキスト説明を生成します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase