Jina Embeddings V2 Base Codeオープンソースコードテキスト埋め込みモデル - 無料でコードの特徴を抽出し、類似度を計算する

ホーム

Jina Embeddings V2 Base Code GGUF

second-stateによって開発

Jina Embeddings V2 Base Codeは、トランスフォーマーアーキテクチャに基づく英語の文埋め込みモデルで、コード関連テキストの特徴抽出と類似度計算に特化しています。

テキスト埋め込み英語オープンソースライセンス:Apache-2.0 #コード埋め込み #高次元ベクトル #長文処理

ダウンロード数 315

リリース時間 : 12/10/2024

モデル概要

このモデルは主に高品質な文埋め込みを生成するために使用され、特にコード関連テキストの処理に適しており、文の類似度計算や特徴抽出タスクをサポートします。

モデル特徴

長文脈サポート

8192トークンの長文脈処理能力をサポート

高品質埋め込み

768次元の高品質な文埋め込みを生成

コード最適化

特にコード関連テキストに最適化されています

MTEBベンチマーク

MTEBベンチマークで優れた性能を発揮

モデル能力

文埋め込み生成

テキスト特徴抽出

文類似度計算

コードテキスト処理

使用事例

コード検索と検索

コードスニペット類似性検索

コードベースで意味的に類似したコードスニペットを検索

コードの再利用率と開発効率を向上

ドキュメント処理

技術文書クラスタリング

技術文書を自動的に分類およびクラスタリング

ドキュメントの整理と検索効率を改善

🚀 jina-embeddings-v2-base-code-GGUF

このプロジェクトは、jina-embeddings-v2-base-codeモデルをGGUF形式に量子化したもので、LlamaEdgeでの実行が可能です。

🚀 クイックスタート

元のモデル

元のモデルは jinaai/jina-embeddings-v2-base-code です。

LlamaEdgeでの実行

LlamaEdgeのバージョン: v0.14.17
プロンプトテンプレート
- プロンプトタイプ: embedding
コンテキストサイズ: 8192
埋め込み次元: 768
LlamaEdgeサービスとして実行するには、以下のコマンドを実行します。

wasmedge --dir .:. --nn-preload default:GGML:AUTO:jina-embeddings-v2-base-code-f16.gguf \
  llama-api-server.wasm \
  --prompt-template embedding \
  --ctx-size 8192 \
  --model-name jina-embeddings-v2-base-code

📚 詳細ドキュメント

量子化されたGGUFモデル

名前	量子化方法	ビット数	サイズ	使用ケース
jina-embeddings-v2-base-code-Q2_K.gguf	Q2_K	2	82.7 MB	最も小さいが、品質が大幅に低下する - ほとんどの用途では推奨されない
jina-embeddings-v2-base-code-Q3_K_L.gguf	Q3_K_L	3	101 MB	小さいが、品質がかなり低下する
jina-embeddings-v2-base-code-Q3_K_M.gguf	Q3_K_M	3	95.6 MB	非常に小さいが、品質が大きく低下する
jina-embeddings-v2-base-code-Q3_K_S.gguf	Q3_K_S	3	89.8 MB	非常に小さいが、品質が大きく低下する
jina-embeddings-v2-base-code-Q4_0.gguf	Q4_0	4	105 MB	レガシー; 小さいが、品質が非常に大きく低下する - Q3_K_Mを使用することを推奨
jina-embeddings-v2-base-code-Q4_K_M.gguf	Q4_K_M	4	109 MB	中程度で、品質がバランスが取れている - 推奨
jina-embeddings-v2-base-code-Q4_K_S.gguf	Q4_K_S	4	105 MB	小さいが、品質がやや低下する
jina-embeddings-v2-base-code-Q5_0.gguf	Q5_0	5	119 MB	レガシー; 中程度で、品質がバランスが取れている - Q4_K_Mを使用することを推奨
jina-embeddings-v2-base-code-Q5_K_M.gguf	Q5_K_M	5	121 MB	大きいが、品質の低下が非常に少ない - 推奨
jina-embeddings-v2-base-code-Q5_K_S.gguf	Q5_K_S	5	119 MB	大きいが、品質の低下が少ない - 推奨
jina-embeddings-v2-base-code-Q6_K.gguf	Q6_K	6	134 MB	非常に大きいが、品質の低下が極めて少ない
jina-embeddings-v2-base-code-Q8_0.gguf	Q8_0	8	173 MB	非常に大きいが、品質の低下が極めて少ない - 推奨されない
jina-embeddings-v2-base-code-f16.gguf	f16	16	323 MB	非常に大きいが、品質の低下が極めて少ない - 推奨されない