EraX-VL-2B-V1.5オープンソース多モーダルモデル - 多言語画像と画像テキストからテキストへの変換をサポート

ホーム

Erax VL 2B V1.5 I1 GGUF

mradermacherによって開発

EraX-VL-2B-V1.5はベトナム語、英語、中国語をサポートするマルチモーダル基盤モデルで、画像からテキストへの変換や画像とテキストの変換が可能です。

画像生成テキスト複数言語対応オープンソースライセンス:Apache-2.0 #マルチモーダル画像テキスト変換 #ベトナム語OCR #保険書類処理

ダウンロード数 467

リリース時間 : 12/29/2024

モデル概要

これは画像からテキスト、および画像とテキストの変換タスクに特化したマルチモーダル視覚言語モデルで、特に保険や光学文字認識(OCR)などの分野に適しています。

モデル特徴

多言語サポート

ベトナム語、英語、中国語の3言語のテキスト処理をサポート

マルチモーダル能力

画像とテキスト入力を処理し、画像からテキストへの変換を実現

多様な量子化バージョン

さまざまなハードウェアと性能ニーズに対応するため、複数の量子化バージョンを提供

モデル能力

画像からテキストへの変換

画像とテキストの変換

多言語処理

光学文字認識(OCR)

使用事例

保険業界

保険書類処理

保険書類の文字情報を自動的に認識・処理

文書デジタル化

文書OCR

スキャンした文書や画像中の文字を編集可能なテキストに変換

🚀 EraX-VL-2B-V1.5

EraX-VL-2B-V1.5は、多言語（ベトナム語、英語、中国語）に対応したマルチモーダルモデルです。保険やOCRなどの分野での画像からテキストへ、画像とテキストからテキストへの変換などのタスクに利用できます。

🚀 クイックスタート

このセクションでは、EraX-VL-2B-V1.5の基本的な使い方や関連情報を紹介します。

📚 ドキュメント

概要

属性	详情
ベースモデル	erax-ai/EraX-VL-2B-V1.5
対応言語	ベトナム語、英語、中国語
ライブラリ名	transformers
ライセンス	apache-2.0
量子化担当者	mradermacher
タグ	erax、multimodal、erax-vl-2B、insurance、ocr、vietnamese、bcg、image-to-text、image-text-to-text

モデルについて

https://huggingface.co/erax-ai/EraX-VL-2B-V1.5 のweighted/imatrix量子化モデルです。静的量子化モデルは https://huggingface.co/mradermacher/EraX-VL-2B-V1.5-GGUF で入手可能です。

使用方法

GGUFファイルの使い方がわからない場合は、TheBloke's READMEs を参照してください。ここには、マルチパートファイルの結合方法などの詳細が記載されています。

提供される量子化モデル

（サイズ順に並べられており、必ずしも品質の順ではありません。IQ量子化モデルは、同じサイズの非IQ量子化モデルよりも優れていることが多いです）

リンク	タイプ	サイズ(GB)	備考
GGUF	i1-IQ1_S	0.5	非常に必要な場合
GGUF	i1-IQ1_M	0.6	ほとんど必要な場合
GGUF	i1-IQ2_XXS	0.6
GGUF	i1-IQ2_XS	0.7
GGUF	i1-IQ2_S	0.7
GGUF	i1-IQ2_M	0.7
GGUF	i1-Q2_K_S	0.7	非常に低品質
GGUF	i1-IQ3_XXS	0.8	低品質
GGUF	i1-Q2_K	0.8	IQ3_XXSの方が良い可能性があります
GGUF	i1-IQ3_XS	0.8
GGUF	i1-Q3_K_S	0.9	IQ3_XSの方が良い可能性があります
GGUF	i1-IQ3_S	0.9	Q3_K*より良い
GGUF	i1-IQ3_M	0.9
GGUF	i1-Q3_K_M	0.9	IQ3_Sの方が良い可能性があります
GGUF	i1-Q3_K_L	1.0	IQ3_Mの方が良い可能性があります
GGUF	i1-IQ4_XS	1.0
GGUF	i1-IQ4_NL	1.0	IQ4_XSを選ぶことをおすすめ
GGUF	i1-Q4_0	1.0	高速、低品質
GGUF	i1-Q4_K_S	1.0	サイズ、速度、品質のバランスが良い
GGUF	i1-Q4_K_M	1.1	高速、おすすめ
GGUF	i1-Q4_1	1.1
GGUF	i1-Q5_K_S	1.2
GGUF	i1-Q5_K_M	1.2
GGUF	i1-Q6_K	1.4	静的Q6_Kに近い

ikawrakowによる低品質量子化タイプの比較グラフ（値が低い方が良い）:

また、Artefact2によるこの問題に関する考察: https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9

よくある質問 / モデルリクエスト

質問に対する回答や他のモデルの量子化を希望する場合は、https://huggingface.co/mradermacher/model_requests を参照してください。

謝辞

私の会社である nethype GmbH に感謝します。彼らは私に会社のサーバーを使用させ、ワークステーションをアップグレードしてくれたことで、私が余暇時間にこの作業を行うことを可能にしてくれました。また、@nicoboss にも感謝します。彼は私に彼のプライベートスーパーコンピューターへのアクセスを許可してくれたことで、私が通常よりもはるかに高品質の多くのimatrix量子化モデルを提供することができるようになりました。