A

Aya Vision 8b

CohereLabsによって開発
Aya Vision 8Bはオープンウェイトの80億パラメータ多言語視覚言語モデルで、23言語の視覚と言語タスクをサポートします。
ダウンロード数 29.94k
リリース時間 : 3/2/2025

モデル概要

OCR、画像説明、視覚推論、要約、質問応答、コードなど多様な視覚言語アプリケーション向けに最適化された多言語モデル。

モデル特徴

多言語サポート
23言語の視覚と言語タスク処理をサポート
効率的な視覚処理
169個の視覚トークンで364x364ピクセル画像ブロックをエンコードし、最大2197個の画像トークンをサポート
長文コンテキストサポート
16Kのコンテキスト長をサポート
オープンウェイト
研究用途向けに80億パラメータ版をオープンウェイトで提供

モデル能力

画像テキスト認識(OCR)
画像説明生成
視覚推論
多言語テキスト生成
画像質問応答
マルチモーダル要約

使用事例

多言語アプリケーション
多言語画像説明
画像に対して異なる言語で説明テキストを生成
23言語の正確な説明をサポート
クロスランゲージ視覚質問応答
画像内容について異なる言語で質問
正確に理解し対応言語で回答
ドキュメント処理
多言語OCR
画像中の多言語テキストを認識
23言語のテキストを高精度で認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase