S

Snowflake Arctic Embed M Long

由Snowflake開發
Snowflake Arctic M Long 是一個基於 sentence-transformers 的句子嵌入模型,專注於句子相似度和特徵提取任務。
下載量 23.79k
發布時間 : 4/12/2024

模型概述

該模型主要用於句子相似度計算和特徵提取,支持多種自然語言處理任務,如分類、聚類、檢索和重排序等。

模型特點

高性能句子嵌入
在多種任務(如分類、檢索、聚類)中表現出色,提供高質量的句子嵌入表示。
多任務支持
支持多種自然語言處理任務,包括句子相似度、分類、聚類和檢索等。
廣泛的數據集評估
在多個公開數據集(如 MTEB)上進行了全面評估,表現優異。

模型能力

句子相似度計算
特徵提取
文本分類
文本聚類
信息檢索
重排序

使用案例

電子商務
商品評論分類
對亞馬遜商品評論進行情感分類,區分正面和負面評價。
在 MTEB AmazonPolarityClassification 數據集上準確率達到 78.74%。
問答系統
問答檢索
在問答社區(如 AskUbuntu)中檢索相似問題。
在 MTEB AskUbuntuDupQuestions 數據集上 MAP 達到 61.36%。
學術研究
論文聚類
對 arXiv 和 bioRxiv 上的學術論文進行主題聚類。
在 MTEB ArxivClusteringP2P 數據集上 V-measure 達到 45.56%。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase