gte - Qwen2 - 7B - instruct - GGUFオープンソース多言語テキスト埋め込みモデル

ホーム

Gte Qwen2 7B Instruct GGUF

mradermacherによって開発

アリババNLPチームが開発した7Bパラメータ規模の多言語テキスト埋め込みモデルで、文類似度タスクに特化し、複数の量子化バージョンを提供

大規模言語モデル英語オープンソースライセンス:Apache-2.0 #英文文埋め込み #高精度意味マッチング #軽量デプロイ

ダウンロード数 510

リリース時間 : 2/16/2025

モデル概要

Qwen2アーキテクチャに基づく7Bパラメータモデルで、主に文類似度計算とテキスト埋め込みタスクに使用され、英語処理をサポート

モデル特徴

複数量子化バージョン

Q2_Kからf16までの12種類の異なる精度の量子化バージョンを提供し、様々なシナリオのニーズに対応

効率的な推論

量子化処理によりモデルサイズが大幅に減少し、最小で3.1GB(Q2_K)となり、リソース制約環境に適している

高品質埋め込み

MTEBなどのベンチマークテストで優れた性能を発揮し、高品質な文埋め込みを生成可能

モデル能力

文埋め込み生成

テキスト類似度計算

意味検索

使用事例

情報検索

ドキュメント類似性検索

大規模ドキュメントライブラリで意味的に類似したドキュメントを迅速に検索

推薦システム

コンテンツ推薦

コンテンツの意味的類似性に基づいてパーソナライズされた推薦を生成

🚀 グテ・クエン2-7Bインストラクト・GGUFモデル

このプロジェクトは、Alibaba-NLP/gte-Qwen2-7B-instructモデルの静的量子化バージョンを提供します。

🚀 クイックスタート

このモデルの静的量子化バージョンについて、以下の情報をご提供します。

📚 ドキュメント

概要

https://huggingface.co/Alibaba-NLP/gte-Qwen2-7B-instruct の静的量子化バージョンです。現時点では、重み付き/イマトリックスの量子化バージョンは利用できません。静的量子化バージョンが公開されてから約1週間後も利用できない場合は、私が計画していない可能性があります。コミュニティディスカッションを開いてリクエストしてください。

使い方

GGUFファイルの使い方がわからない場合は、TheBlokeのREADME を参照してください。複数のパートファイルを結合する方法など、詳細な情報が記載されています。

提供される量子化バージョン

（サイズ順に並べられており、必ずしも品質順ではありません。IQ量子化は、同じサイズの非IQ量子化よりも優れていることが多いです）

リンク	タイプ	サイズ (GB)	備考
GGUF	Q2_K	3.1
GGUF	Q3_K_S	3.6
GGUF	Q3_K_M	3.9	品質が低い
GGUF	Q3_K_L	4.2
GGUF	IQ4_XS	4.3
GGUF	Q4_K_S	4.6	高速で、おすすめ
GGUF	Q4_K_M	4.8	高速で、おすすめ
GGUF	Q5_K_S	5.4
GGUF	Q5_K_M	5.5
GGUF	Q6_K	6.4	非常に良い品質
GGUF	Q8_0	8.2	高速で、最高品質
GGUF	f16	15.3	16 bpw, 過剰

ikawrakowによる、いくつかの低品質量子化タイプを比較した便利なグラフです（数値が低いほど良い）：

Artefact2によるこの問題に関する考え方はこちらです： https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9

よくある質問 / モデルリクエスト

質問に対する回答や、他のモデルの量子化を希望する場合は、https://huggingface.co/mradermacher/model_requests を参照してください。

謝辞

私の会社 nethype GmbH には、サーバーの使用を許可し、ワークステーションをアップグレードして、私が余暇時間にこの作業を行えるようにしてくれたことに感謝します。また、@nicoboss には、私が彼のプライベートスーパーコンピューターを利用できるようにしてくれたことに感謝します。これにより、私は通常よりも多くのイマトリックス量子化バージョンを、はるかに高い品質で提供することができました。