Moondream2
Moondream 是一款輕量級視覺語言模型,專為高效全平臺運行設計。
下載量 184.93k
發布時間 : 3/4/2024
模型概述
Moondream 是一個高效的視覺語言模型,能夠處理圖像文本生成文本的任務,支持圖像描述生成、視覺問答、目標檢測和指向識別等功能。
模型特點
輕量級設計
專為高效全平臺運行設計,適合在各種硬件環境下使用。
多任務支持
支持圖像描述生成、視覺問答、目標檢測和指向識別等多種任務。
頻繁更新
模型更新頻繁,提供版本號以確保生產環境的穩定性。
模型能力
圖像描述生成
視覺問答
目標檢測
指向識別
圖表理解
文檔表格OCR
界面理解
文本理解
使用案例
圖像分析
圖像描述生成
生成圖像的簡短或標準描述。
視覺問答
回答關於圖像內容的自然語言問題。
目標檢測
人臉檢測
檢測圖像中的人臉數量。
人物定位
定位圖像中的人物位置。
文檔處理
文檔表格OCR
優化文檔表格的OCR識別。
文檔佈局識別
識別文檔中的圖表、公式、文本等佈局。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98