A

Aya Vision 8b

由CohereLabs開發
Aya Vision 8B是一個開放權重的80億參數多語言視覺語言模型,支持23種語言的視覺和語言任務。
下載量 29.94k
發布時間 : 3/2/2025

模型概述

針對多種視覺語言應用場景優化的多語言模型,包括OCR、圖像描述、視覺推理、摘要、問答、代碼等任務。

模型特點

多語言支持
支持23種語言的視覺和語言任務處理
高效視覺處理
使用169個視覺標記編碼364x364像素圖像塊,支持最多2197個圖像標記
長上下文支持
支持16K的上下文長度
開放權重
提供開放權重的80億參數版本供研究使用

模型能力

圖像文本識別(OCR)
圖像描述生成
視覺推理
多語言文本生成
圖像問答
多模態摘要

使用案例

多語言應用
多語言圖像描述
為圖像生成不同語言的描述文本
支持23種語言的準確描述
跨語言視覺問答
用不同語言提問關於圖像內容的問題
準確理解並用相應語言回答
文檔處理
多語言OCR
識別圖像中的多語言文本
高精度識別23種語言的文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase