V

Vintern 3B R Beta

5CD-AIによって開発
Vintern-3B-R-betaは画像ベースの複雑な推論タスクに特化したマルチモーダル大規模言語モデルで、推論ステップを分解し幻覚現象を効果的に制御できます。
ダウンロード数 1,841
リリース時間 : 3/19/2025

モデル概要

このモデルは視覚と言語処理能力を組み合わせ、構造化されたドキュメント画像と複雑な問題推論の処理に優れ、ベトナム語、英語、中国語をサポートしています。

モデル特徴

複雑な推論能力
画像に基づく長鎖複雑推論が可能で、推論ステップを複数のサブステップに分解できます
多言語サポート
ベトナム語、英語、中国語の3言語処理をサポート
幻覚制御
推論プロセス中に幻覚現象の発生を効果的に制御
マルチモーダル処理
視覚と言語処理能力を組み合わせ、構造化ドキュメント画像を処理

モデル能力

画像理解
複雑な推論
多言語テキスト生成
構造化ドキュメント処理
OCRテキスト抽出

使用事例

飲食業界
メニュー価格分析
レストランメニュー画像から料理情報を抽出し価格を比較
最高価格の料理を正確に識別
政府文書処理
公文書テキスト抽出
政府公文書画像から完全なテキスト内容を抽出
ベトナム語政府公文書の内容を正確に抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase