# 日語視覺問答

Heron NVILA Lite 1B
Apache-2.0
基於NVILA-Lite架構訓練的日語視覺語言模型,支持日語和英語的圖文交互
圖像生成文本 支持多種語言
H
turing-motors
460
2
Sarashina2 Vision 14b
MIT
Sarashina2-Vision-14B是由SB Intuitions開發的日本大型視覺語言模型,結合了Sarashina2-13B和Qwen2-VL-7B的圖像編碼器,在多個基準測試中表現優異。
圖像生成文本 Transformers 支持多種語言
S
sbintuitions
192
6
Sarashina2 Vision 8b
MIT
Sarashina2-Vision-8B是由SB Intuitions訓練的日本大型視覺語言模型,基於Sarashina2-7B和Qwen2-VL-7B的圖像編碼器,在多個基準測試中表現優異。
圖像生成文本 Transformers 支持多種語言
S
sbintuitions
1,233
4
Llm Jp 3 Vila 14b
由日本國立情報學研究所開發的大型視覺語言模型,支持日語和英語,具備強大的圖像理解和文本生成能力。
圖像生成文本 Safetensors 日語
L
llm-jp
106
10
Convllava JP 1.3b 1280
ConvLLaVA-JP是一款支持高分辨率輸入的日語視覺語言模型,能夠就輸入圖像進行對話。
圖像生成文本 Transformers 日語
C
toshi456
31
1
Llava Calm2 Siglip
Apache-2.0
llava-calm2-siglip 是一個實驗性的視覺語言模型,能夠用日語和英語回答關於圖像的問題。
圖像生成文本 Transformers 支持多種語言
L
cyberagent
3,930
25
Chat Vector Llava V1.5 7b Ja
一款能夠用日語就輸入圖像進行對話的視覺語言模型,採用Chat Vector方法結合多個模型權重創建
圖像生成文本 Transformers 日語
C
toshi456
26
1
Llava Jp 1.3b V1.1
LLaVA-JP是一個支持日語的多模態視覺語言模型,能夠理解和生成關於輸入圖像的描述和對話。
圖像生成文本 Transformers 日語
L
toshi456
90
11
Evovlm JP V1 7B
Apache-2.0
EvoVLM-JP-v1-7B 是一款實驗性通用日語視覺語言模型,採用進化式模型融合方法創建
圖像生成文本 Transformers 日語
E
SakanaAI
46
36
Heron Chat Blip Ja Stablelm Base 7b V1 Llava 620k
一個能夠就輸入圖像進行對話的視覺語言模型,支持日語交互
圖像生成文本 Transformers 日語
H
turing-motors
25
3
Heron Chat Blip Ja Stablelm Base 7b V1
這是一個能夠就輸入圖像進行對話的視覺語言模型,支持日語交流。
圖像生成文本 Transformers 日語
H
turing-motors
40
3
Llava Jp 1.3b V1.0
LLaVA-JP是一個能夠就輸入圖像進行對話的日語視覺語言模型,基於LLaVA方法對llm-jp-1.3b-v1.0進行微調訓練而成。
圖像生成文本 Transformers 日語
L
toshi456
30
5
Heron Chat Git ELYZA Fast 7b V0
一個能夠對輸入圖像進行對話的視覺語言模型,支持日語交互
圖像生成文本 Transformers 日語
H
turing-motors
17
3
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase