Jina Embeddings V2 Base Codeオープンソースモデル - 無料で使いやすいコードテキストの特徴抽出と類似度計算ツール

Jina Embeddings V2 Base Code GGUF

gaianetによって開発

Jina Embeddings V2 Base Codeは、Transformerアーキテクチャに基づく英語テキスト埋め込みモデルで、コード関連テキストの特徴抽出と文類似度計算に特化しています。

ダウンロード数 575

リリース時間 : 12/10/2024

モデル概要

このモデルは主に高品質なテキスト埋め込み表現を生成するために使用され、特にコード関連の英語テキストの処理に適しています。テキストを768次元のベクトル表現に変換でき、情報検索、意味検索などのタスクに適用可能です。

長文コンテキスト対応

最大8192トークンのコンテキスト長をサポートし、長文ドキュメントやコードスニペットの処理に適しています。

高品質埋め込み

768次元の高品質なテキスト埋め込み表現を生成し、深層的な意味情報を捕捉します。

コード最適化

特にコード関連テキストに最適化されており、プログラミング言語や技術文書の処理に適しています。

テキスト埋め込み生成

文類似度計算

特徴抽出

意味検索

情報検索

コード検索

コードリポジトリ内で意味的に類似したコードスニペットを検索

コード検索の精度と効率を向上

意味解析

技術文書クラスタリング

類似した技術文書を自動的にグループ化

文書の整理と管理効率を向上

属性	详情
ベースモデル	jinaai/jina-embeddings-v2-base-code
ライセンス	apache-2.0
モデル作成者	jinaai
量子化実行者	Second State Inc.
言語	en
推論	false
タグ	sentence-transformers, feature-extraction, sentence-similarity, mteb, transformers, transformers.js