A

Aya Vision 32b

由CohereLabs開發
Aya Vision 32B是Cohere實驗室開發的開放權重32B參數多模態模型,支持23種語言的視覺語言任務。
下載量 387
發布時間 : 3/2/2025

模型概述

針對多種視覺語言任務優化的多語言模型,包括OCR、圖像描述、視覺推理、摘要、問答、代碼生成等。

模型特點

多語言支持
支持23種語言的視覺語言任務處理
高分辨率圖像處理
支持364x364像素分辨率,最多2197個圖像標記
長上下文支持
16K上下文長度,適合處理複雜任務
多模態適配器
結合先進文本模型與視覺編碼器的創新架構

模型能力

圖像描述生成
視覺問答
多語言OCR
視覺推理
文本摘要
代碼生成
跨模態理解

使用案例

內容理解
多語言圖像描述
為圖像生成不同語言的描述文本
支持23種語言的準確描述
文檔OCR
從圖像中提取多語言文本內容
高精度文字識別
智能交互
視覺問答
回答關於圖像內容的複雜問題
支持多語言問答
教育輔助
解釋圖像中的教育內容
多語言教學支持
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase