モデル選定

日本語視覚質問応答

# 日本語視覚質問応答

Heron NVILA Lite 1B

NVILA-Liteアーキテクチャでトレーニングされた日本語視覚言語モデル、日本語と英語の画像テキストインタラクションをサポート

画像生成テキスト

Safetensors 複数言語対応

Sarashina2 Vision 14b

Sarashina2-Vision-14BはSB Intuitionsによって開発された日本の大規模視覚言語モデルで、Sarashina2-13BとQwen2-VL-7Bの画像エンコーダーを組み合わせており、複数のベンチマークテストで優れた性能を示しています。

画像生成テキスト

Transformers 複数言語対応

Sarashina2 Vision 8b

Sarashina2-Vision-8BはSB Intuitionsによってトレーニングされた日本の大規模視覚言語モデルで、Sarashina2-7BとQwen2-VL-7Bの画像エンコーダーを基にしており、複数のベンチマークテストで優れたパフォーマンスを発揮しています。

画像生成テキスト

Transformers 複数言語対応

Llm Jp 3 Vila 14b

国立情報学研究所によって開発された大規模視覚言語モデルで、日本語と英語をサポートし、強力な画像理解とテキスト生成能力を備えています。

画像生成テキスト

Safetensors 日本語

Convllava JP 1.3b 1280

ConvLLaVA-JPは高解像度入力に対応した日本語視覚言語モデルで、入力画像について対話が可能です。

画像生成テキスト

Transformers 日本語

Llava Calm2 Siglip

llava-calm2-siglip は実験的な視覚言語モデルで、画像に関する質問に日本語と英語で回答できます。

画像生成テキスト

Transformers 複数言語対応

Chat Vector Llava V1.5 7b Ja

入力画像に対して日本語で対話可能な視覚言語モデルで、Chat Vector手法を用いて複数のモデル重みを統合して作成

画像生成テキスト

Transformers 日本語

Llava Jp 1.3b V1.1

LLaVA-JPは日本語をサポートするマルチモーダル視覚言語モデルで、入力画像に関する説明や対話を理解し生成できます。

画像生成テキスト

Transformers 日本語

Evovlm JP V1 7B

EvoVLM-JP-v1-7B は実験的な汎用日本語視覚言語モデルで、進化的モデル融合手法を用いて作成されました

画像生成テキスト

Transformers 日本語

Heron Chat Blip Ja Stablelm Base 7b V1 Llava 620k

入力画像について対話可能な視覚言語モデルで、日本語インタラクションをサポート

画像生成テキスト

Transformers 日本語

Heron Chat Blip Ja Stablelm Base 7b V1

これは入力画像について対話可能な視覚言語モデルで、日本語でのコミュニケーションをサポートします。

画像生成テキスト

Transformers 日本語

Llava Jp 1.3b V1.0

LLaVA-JPは入力画像について対話可能な日本語視覚言語モデルで、LLaVA手法を用いてllm-jp-1.3b-v1.0をファインチューニングして作成されました。

画像生成テキスト

Transformers 日本語

Heron Chat Git ELYZA Fast 7b V0

入力画像に対して対話可能な視覚言語モデルで、日本語インタラクションをサポート

画像生成テキスト

Transformers 日本語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase