# ベトナム語OCR

Vintern 3B R Beta
MIT
Vintern-3B-R-betaは画像ベースの複雑な推論タスクに特化したマルチモーダル大規模言語モデルで、推論ステップを分解し幻覚現象を効果的に制御できます。
画像生成テキスト Transformers 複数言語対応
V
5CD-AI
1,841
14
Erax VL 7B V2.0 Preview I1 GGUF
Apache-2.0
これはEraX-VL-7B-V2.0-Previewモデルを重み/重要度行列量子化した結果で、様々なニーズに対応する複数の量子化バージョンを提供します
画像生成テキスト 複数言語対応
E
mradermacher
246
1
Vintern 1B V3 5
MIT
Vintern-1B-v3.5はInternVL2.5-1Bを微調整したマルチモーダル大規模言語モデルで、ベトナム語テキスト処理に特化しており、OCRやベトナム特有の文書理解において優れた性能を発揮します。
画像生成テキスト Transformers 複数言語対応
V
5CD-AI
6,875
35
Erax VL 7B V2.0 Preview
Apache-2.0
EraX-VL-7B-V2.0-Previewは、OCRと視覚的質問応答のために設計された強力なマルチモーダルモデルで、ベトナム語を含む複数言語の処理に優れ、医療用フォームや請求書などのドキュメント認識で特に優れた性能を発揮します。
画像生成テキスト Transformers 複数言語対応
E
erax-ai
476
22
Erax VL 2B V1.5 I1 GGUF
Apache-2.0
EraX-VL-2B-V1.5はベトナム語、英語、中国語をサポートするマルチモーダル基盤モデルで、画像からテキストへの変換や画像とテキストの変換が可能です。
画像生成テキスト 複数言語対応
E
mradermacher
467
0
Pretrained Trocr Small Vietnamese Nom
ベトナム語音声認識に特化したモデルで、高精度な音声からテキストへの変換機能をサポートします。
機械翻訳 Transformers その他
P
nxquang-al
19
2
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase