日語視覺問答

# 日語視覺問答

Heron NVILA Lite 1B

基於NVILA-Lite架構訓練的日語視覺語言模型，支持日語和英語的圖文交互

圖像生成文本支持多種語言

Sarashina2 Vision 14b

Sarashina2-Vision-14B是由SB Intuitions開發的日本大型視覺語言模型，結合了Sarashina2-13B和Qwen2-VL-7B的圖像編碼器，在多個基準測試中表現優異。

圖像生成文本

Transformers 支持多種語言

Sarashina2 Vision 8b

Sarashina2-Vision-8B是由SB Intuitions訓練的日本大型視覺語言模型，基於Sarashina2-7B和Qwen2-VL-7B的圖像編碼器，在多個基準測試中表現優異。

圖像生成文本

Transformers 支持多種語言

Llm Jp 3 Vila 14b

由日本國立情報學研究所開發的大型視覺語言模型，支持日語和英語，具備強大的圖像理解和文本生成能力。

圖像生成文本

Safetensors 日語

Convllava JP 1.3b 1280

ConvLLaVA-JP是一款支持高分辨率輸入的日語視覺語言模型，能夠就輸入圖像進行對話。

圖像生成文本

Transformers 日語

Llava Calm2 Siglip

llava-calm2-siglip 是一個實驗性的視覺語言模型，能夠用日語和英語回答關於圖像的問題。

圖像生成文本

Transformers 支持多種語言

Chat Vector Llava V1.5 7b Ja

一款能夠用日語就輸入圖像進行對話的視覺語言模型，採用Chat Vector方法結合多個模型權重創建

圖像生成文本

Transformers 日語

Llava Jp 1.3b V1.1

LLaVA-JP是一個支持日語的多模態視覺語言模型，能夠理解和生成關於輸入圖像的描述和對話。

圖像生成文本

Transformers 日語

Evovlm JP V1 7B

EvoVLM-JP-v1-7B 是一款實驗性通用日語視覺語言模型，採用進化式模型融合方法創建

圖像生成文本

Transformers 日語

Heron Chat Blip Ja Stablelm Base 7b V1 Llava 620k

一個能夠就輸入圖像進行對話的視覺語言模型，支持日語交互

圖像生成文本

Transformers 日語

Heron Chat Blip Ja Stablelm Base 7b V1

這是一個能夠就輸入圖像進行對話的視覺語言模型，支持日語交流。

圖像生成文本

Transformers 日語

Llava Jp 1.3b V1.0

LLaVA-JP是一個能夠就輸入圖像進行對話的日語視覺語言模型，基於LLaVA方法對llm-jp-1.3b-v1.0進行微調訓練而成。

圖像生成文本

Transformers 日語

Heron Chat Git ELYZA Fast 7b V0

一個能夠對輸入圖像進行對話的視覺語言模型，支持日語交互

圖像生成文本

Transformers 日語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase