Internvl3 8B AWQ
その他
InternVL3-8BはOpenGVLabが開発した先進的なマルチモーダル大規模言語モデルで、強力なマルチモーダル知覚と推論能力を備え、ツール呼び出し、GUIエージェント、産業画像分析、3D視覚知覚などの新領域をサポートします。
画像生成テキスト
Transformers その他

I
OpenGVLab
1,441
3
Internvl3 2B Instruct
Apache-2.0
InternVL3-2B-InstructはInternVL3-2Bを基にした教師付き微調整バージョンで、ネイティブマルチモーダル事前学習とSFT処理を経ており、強力なマルチモーダル知覚と推論能力を備えています。
テキスト生成画像
Transformers その他

I
OpenGVLab
1,345
4
Aya Vision 32b
Aya Vision 32BはCohereラボが開発したオープンウェイト32Bパラメータのマルチモーダルモデルで、23言語の視覚言語タスクをサポートします。
画像生成テキスト
Transformers 複数言語対応

A
CohereLabs
387
193
Aya Vision 8b
Aya Vision 8Bはオープンウェイトの80億パラメータ多言語視覚言語モデルで、23言語の視覚と言語タスクをサポートします。
画像生成テキスト
Transformers 複数言語対応

A
CohereLabs
29.94k
282
Colqwen2.5 3b Multilingual V1.0
MIT
Qwen2.5-VL-3B-InstructをベースにColBERT戦略を採用した多言語視覚検索モデルで、Vidoreベンチマークテストで優れた性能を発揮
テキスト生成画像 複数言語対応
C
Metric-AI
2,475
7
Erax VL 2B V1.5 I1 GGUF
Apache-2.0
EraX-VL-2B-V1.5はベトナム語、英語、中国語をサポートするマルチモーダル基盤モデルで、画像からテキストへの変換や画像とテキストの変換が可能です。
画像生成テキスト 複数言語対応
E
mradermacher
467
0
Pix2struct Textcaps Base
Apache-2.0
Pix2Structは視覚言語理解モデルで、事前学習とファインチューニングにより画像からテキストへのタスクを処理し、特に画像キャプション生成に適しています。
画像生成テキスト
Transformers 複数言語対応

P
google
3,888
28
Pix2struct Screen2words Base
Apache-2.0
Pix2Structは、UIインターフェースのスクリーンショットから機能説明の字幕を生成するために最適化された視覚言語理解モデルです
画像生成テキスト
Transformers 複数言語対応

P
google
262
24
Pix2struct Infographics Vqa Base
Apache-2.0
Pix2Structは視覚言語理解モデルで、画像からテキストへの変換タスクを事前学習により処理し、特に高解像度インフォグラフィックの視覚QAに最適化されています。
画像生成テキスト
Transformers 複数言語対応

P
google
74
8
Pix2struct Infographics Vqa Large
Apache-2.0
Pix2Structは画像エンコーダ-テキストデコーダモデルで、マルチタスク訓練により視覚言語理解タスクを処理し、特に高解像度インフォグラフィックの視覚的質問応答に最適化されています。
画像生成テキスト
Transformers 複数言語対応

P
google
108
10
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98