H

Heron NVILA Lite 33B

turing-motorsによって開発
Heron-NVILA-Lite-33B はNVILA-Liteアーキテクチャに基づき、日本語に特化してトレーニングされたビジュアルランゲージモデルで、日本語と英語のマルチモーダルタスクをサポートします。
ダウンロード数 99
リリース時間 : 5/12/2025

モデル概要

このモデルはビジュアルエンコーダーと言語モデルを組み合わせており、画像とテキストのインタラクティブタスクを処理でき、特に日本語環境でのパフォーマンスが最適化されています。

モデル特徴

日本語最適化
日本語環境に特化してトレーニングされており、日本語ビジュアルランゲージタスクで優れた性能を発揮します
マルチモーダル能力
画像とテキスト入力を同時に処理し、画像とテキストのインタラクションを実現します
高性能アーキテクチャ
先進的なビジュアルエンコーダーと言語モデルを組み合わせ、強力な推論能力を提供します

モデル能力

画像キャプション生成
ビジュアルQA
マルチターン画像テキスト対話
クロスランゲージ理解
画像コンテンツ分析

使用事例

コンテンツ理解
画像キャプション生成
入力画像に対して詳細なテキスト説明を生成します
日本語ビジュアルQA500テストで3.85/5.0点を獲得
カスタマーサービス
マルチターン画像テキスト対話
画像ベースのマルチターン対話インタラクションをサポートします
日本語VLM野外ベンチマークテストで4.0/5.0点を獲得
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase