gte-Qwen2-1.5B-instruct-GGUFオープンソースモデル - 文章の類似度計算とテキスト埋め込みに無料で利用可能

ホーム

Gte Qwen2 1.5B Instruct GGUF

mradermacherによって開発

阿里巴巴NLP/gte-Qwen2-1.5B-instructの量子化バージョンで、主に文の類似度計算とテキスト埋め込みタスクに使用されます。

大規模言語モデル英語オープンソースライセンス:Apache-2.0 #英文文埋め込み #軽量量子化 #テキスト類似度計算

ダウンロード数 365

リリース時間 : 2/16/2025

モデル概要

これは1.5Bパラメータのテキスト埋め込みモデルで、量子化処理により推論効率を最適化し、英語テキスト処理をサポート、文の類似度計算などの自然言語処理タスクに適しています。

モデル特徴

マルチ量子化バージョン

Q2_Kからf16までの12種類の量子化バージョンを提供し、様々なシナリオでの精度と効率のニーズに対応

効率的な推論

量子化バージョンはモデルサイズを大幅に縮小し推論速度を向上、リソース制約環境に適しています

文埋め込み

文の類似度計算に最適化され、高品質なテキスト埋め込み表現を生成可能

モデル能力

テキスト埋め込み生成

文の類似度計算

意味検索

テキストクラスタリング

使用事例

情報検索

意味検索

キーワードマッチングではなく意味に基づくドキュメント検索システム

検索結果の関連性向上

テキスト分析

ドキュメント重複排除

文埋め込みを通じて意味的に類似した重複ドキュメントを識別

テキスト処理効率の向上

🚀 gte-Qwen2-1.5B-instruct 静的量子化モデル

このプロジェクトはAlibaba-NLP/gte-Qwen2-1.5B-instructの静的量子化モデルを提供します。モデルの使用方法や提供される量子化タイプについて説明しています。

🚀 クイックスタート

このモデルはAlibaba-NLP/gte-Qwen2-1.5B-instructの静的量子化バージョンです。以下に、このモデルに関する基本的な情報をまとめます。

属性	详情
ベースモデル	Alibaba-NLP/gte-Qwen2-1.5B-instruct
言語	en
ライブラリ名	transformers
ライセンス	apache-2.0
量子化担当者	mradermacher
タグ	mteb、sentence-transformers、transformers、Qwen2、sentence-similarity

📚 ドキュメント

概要

https://huggingface.co/Alibaba-NLP/gte-Qwen2-1.5B-instruct の静的量子化モデルです。現時点では、重み付き/インマトリックス量子化は利用できない可能性があります。静的量子化モデルが公開されてから約1週間後にまだ利用できない場合、私はそれらを計画していない可能性があります。コミュニティディスカッションを開いてリクエストすることができます。

使用方法

GGUFファイルの使用方法がわからない場合は、TheBlokeのREADME を参照してください。ここには、マルチパートファイルの結合方法などの詳細が記載されています。

提供される量子化モデル

（サイズでソートされており、必ずしも品質を表しているわけではありません。IQ量子化は同程度のサイズの非IQ量子化よりも優れていることが多いです）

リンク	タイプ	サイズ(GB)	備考
GGUF	Q2_K	0.9
GGUF	Q3_K_S	1.0
GGUF	Q3_K_M	1.0	低品質
GGUF	Q3_K_L	1.1
GGUF	IQ4_XS	1.1
GGUF	Q4_K_S	1.2	高速、推奨
GGUF	Q4_K_M	1.2	高速、推奨
GGUF	Q5_K_S	1.4
GGUF	Q5_K_M	1.4
GGUF	Q6_K	1.6	非常に高品質
GGUF	Q8_0	2.0	高速、最高品質
GGUF	f16	3.7	16 bpw、過剰