J

Jina Embeddings V2 Base Zh

由silverjam開發
Jina Embeddings V2 Base 是一個針對中文優化的句子嵌入模型,能夠將文本轉換為高維向量表示,用於計算句子相似度和特徵提取。
下載量 63
發布時間 : 6/5/2024

模型概述

該模型專注於中文文本的嵌入表示,支持多種自然語言處理任務,如句子相似度計算、文本分類和聚類等。

模型特點

中文優化
專門針對中文文本進行優化,提供更準確的中文句子嵌入表示。
多任務支持
支持多種自然語言處理任務,包括句子相似度計算、文本分類和聚類等。
高性能
在多箇中文基準測試中表現出色,特別是在句子相似度任務上。

模型能力

句子嵌入生成
文本特徵提取
句子相似度計算
文本分類
文本聚類
信息檢索

使用案例

信息檢索
醫療問答檢索
在醫療問答系統中用於檢索相關問題和答案
在CMedQA數據集上表現出色,MAP達到83.74
文本相似度
問答對匹配
判斷問題和答案之間的相關性
在AFQMC數據集上餘弦相似度皮爾遜值為48.51
文本分類
商品評論分類
對中文商品評論進行情感或主題分類
在Amazon中文評論分類任務上準確率達到34.94%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase