E

Erax VL 7B V2.0 Preview

erax-aiによって開発
EraX-VL-7B-V2.0-Previewは、OCRと視覚的質問応答のために設計された強力なマルチモーダルモデルで、ベトナム語を含む複数言語の処理に優れ、医療用フォームや請求書などのドキュメント認識で特に優れた性能を発揮します。
ダウンロード数 476
リリース時間 : 1/11/2025

モデル概要

LLMベースの視覚的大規模言語モデルで、OCRと視覚的質問応答タスクに特化しており、特にベトナム語処理能力が最適化されており、医療、保険などの分野のドキュメント分析に適しています。

モデル特徴

ベトナム語最適化
特にベトナム語に最適化されており、ベトナム語OCRと質問応答タスクで優れた性能を発揮します
マルチモーダル能力
視覚と言語理解能力を組み合わせ、画像とテキストの複雑な相互作用を処理できます
医療ドキュメント分析
医療用フォーム、処方箋、X線画像などの専門ドキュメントの分析に優れています
事故分析
事故写真を分析し、損傷状況を説明し、修復提案を行うことができます

モデル能力

画像テキスト認識
視覚的質問応答
ドキュメント質問応答
医療画像分析
多言語処理
事故写真分析

使用事例

医療健康
放射線画像分析
X線、CT、MRI画像を分析し、診断を支援
心臓CTスキャンの異常指標を識別し、予備診断提案を提供できます
処方箋認識
医療処方箋の内容を識別・解析
処方箋中の薬物と投与量情報を正確に抽出できます
保険
事故評価
自動車事故写真を分析し損傷程度を評価
損傷状況を詳細に説明し、修復提案を行います
ドキュメント処理
請求書認識
請求書のキー情報を識別・抽出
請求金額、日付などのキーフィールドを正確に抽出できます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase