Jina Embeddings V2 Base Code開源模型 - 免費好用的代碼文本特徵提取和相似度計算工具

Jina Embeddings V2 Base Code GGUF

由gaianet開發

Jina Embeddings V2 Base Code 是一個基於轉換器架構的英文文本嵌入模型，專注於代碼相關文本的特徵提取和句子相似度計算。

下載量 575

發布時間 : 12/10/2024

模型概述

該模型主要用於生成高質量的文本嵌入表示，特別適合處理代碼相關的英文文本。它能夠將文本轉換為768維的向量表示，適用於信息檢索、語義搜索等任務。

長上下文支持

支持長達8192個token的上下文長度，適合處理長文檔和代碼片段。

高質量嵌入

生成768維的高質量文本嵌入表示，捕捉深層次的語義信息。

代碼優化

特別針對代碼相關文本進行了優化，適合處理編程語言和技術文檔。

文本嵌入生成

句子相似度計算

特徵提取

語義搜索

信息檢索

代碼搜索

在代碼庫中搜索語義相似的代碼片段

提高代碼檢索的準確性和效率

語義分析

技術文檔聚類

將相似的技術文檔自動分組

提升文檔組織和管理效率

屬性	詳情
基礎模型	jinaai/jina-embeddings-v2-base-code
許可證	apache-2.0
模型創建者	jinaai
量化者	Second State Inc.
語言	英文
推理	否
標籤	sentence-transformers、feature-extraction、sentence-similarity、mteb、transformers、transformers.js