Qwen2.5-VL-7B-Abliterated-Caption-it-i1-GGUFオープンソースモデル - 無料でデプロイして多言語画像記述を実現

ホーム

Qwen2.5 VL 7B Abliterated Caption It I1 GGUF

mradermacherによって開発

Qwen2.5-VL-7B-Abliterated-Caption-itの量子化バージョンで、多言語画像記述タスクをサポートします。

画像生成テキスト

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #多言語画像記述 #視覚言語モデル #低リソース量子化

ダウンロード数 167

リリース時間 : 7/23/2025

モデル概要

これは視覚言語モデルで、画像記述などの視覚理解タスクに特化しており、英語、中国語、タイ語をサポートします。

モデル特徴

多言語サポート

英語、中国語、タイ語の3つの言語の画像記述生成をサポートします。

複数の量子化バージョン

さまざまな量子化バージョンを提供し、異なるハードウェアと性能要件に対応します。

視覚理解能力

画像内容を理解し、正確な記述を生成することができます。

モデル能力

画像記述生成

多言語テキスト生成

視覚コンテンツ理解

使用事例

画像記述

自動画像注釈

画像に記述的なテキストを生成し、コンテンツ管理と検索に使用します。

視覚障害者の支援

音声合成を通じて画像内容を視覚障害者に説明します。

多言語アプリケーション

クロス言語コンテンツ生成

同じ画像に対して異なる言語の記述を生成します。

🚀 Qwen2.5-VL-7B-Abliterated-Caption-it モデル

このモデルは画像キャプショニングや視覚理解などのタスクに特化したビジュアル言語モデル（VLM）です。複数の言語に対応しており、transformersライブラリを使用して操作できます。

🚀 クイックスタート

モデル情報

属性	详情
ベースモデル	prithivMLmods/Qwen2.5-VL-7B-Abliterated-Caption-it
データセット	prithivMLmods/blip3o-caption-mini-arrow、prithivMLmods/Caption3o-Opt-v2
対応言語	英語、中国語、タイ語
ライブラリ名	transformers
ライセンス	apache-2.0
量子化担当者	mradermacher
タグ	text-generation-inference、uncensored、image-captioning、vlm、visual-understanding、caption、image-to-text

モデルについて

weighted/imatrix quants of https://huggingface.co/prithivMLmods/Qwen2.5-VL-7B-Abliterated-Caption-it

便利な概要とダウンロードリストについては、このモデルのモデルページをご覧ください。

静的量子化モデルは https://huggingface.co/mradermacher/Qwen2.5-VL-7B-Abliterated-Caption-it-GGUF で入手できます。

これはビジュアルモデルです。mmprojファイル（ある場合）は静的リポジトリにあります。

使用方法

GGUFファイルの使用方法がわからない場合は、TheBlokeのREADMEを参照してください。複数パートのファイルを結合する方法などの詳細も記載されています。

提供される量子化モデル

（サイズでソートされていますが、必ずしも品質を表すわけではありません。IQ量子化モデルは同サイズの非IQ量子化モデルよりも優れていることが多いです）

リンク	タイプ	サイズ(GB)	備考
GGUF	imatrix	0.1	独自の量子化モデルを作成するためのimatrixファイル
GGUF	i1-IQ1_S	2.0	非常に必要な場合に使用
GGUF	i1-IQ2_XXS	2.4
GGUF	i1-IQ2_XS	2.6
GGUF	i1-IQ2_S	2.7
GGUF	i1-IQ2_M	2.9
GGUF	i1-Q2_K_S	2.9	非常に低品質
GGUF	i1-Q2_K	3.1	IQ3_XXSの方が良い可能性があります
GGUF	i1-IQ3_XXS	3.2	低品質
GGUF	i1-IQ3_XS	3.4
GGUF	i1-Q3_K_S	3.6	IQ3_XSの方が良い可能性があります
GGUF	i1-IQ3_S	3.6	Q3_K*よりも良い
GGUF	i1-IQ3_M	3.7
GGUF	i1-Q3_K_M	3.9	IQ3_Sの方が良い可能性があります
GGUF	i1-Q3_K_L	4.2	IQ3_Mの方が良い可能性があります
GGUF	i1-IQ4_XS	4.3
GGUF	i1-IQ4_NL	4.5	IQ4_XSを選ぶことをおすすめ
GGUF	i1-Q4_0	4.5	高速だが低品質
GGUF	i1-Q4_K_S	4.6	サイズ/速度/品質のバランスが良い
GGUF	i1-Q4_K_M	4.8	高速でおすすめ
GGUF	i1-Q4_1	5.0
GGUF	i1-Q5_K_S	5.4
GGUF	i1-Q5_K_M	5.5
GGUF	i1-Q6_K	6.4	静的Q6_Kに近い品質

ikawrakowによる低品質量子化タイプの比較グラフです（値が低い方が良い）：

また、Artefact2によるこの問題に関する考察もご覧ください： https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9

よくある質問とモデルリクエスト

質問に対する回答や他のモデルの量子化を依頼する場合は、https://huggingface.co/mradermacher/model_requests を参照してください。

謝辞

この作業を可能にするために、私の会社であるnethype GmbHにはサーバーの使用を許可し、ワークステーションのアップグレードを提供してくれたことに感謝します。また、@nicobossには私が多くのimatrix量子化モデルを高品質で提供できるよう、プライベートスーパーコンピューターへのアクセスを許可してくれたことに感謝します。