I

Instructor Large Safetensors

由gentlebowl開發
INSTRUCTOR 是一個基於 T5 架構的文本嵌入模型,專注於句子相似度計算和信息檢索任務。它在多種 NLP 任務上表現出色,包括文本分類、聚類和語義相似度評估。
下載量 16
發布時間 : 4/25/2023

模型概述

INSTRUCTOR 是一個強大的文本嵌入模型,能夠將文本轉換為高質量的向量表示,適用於信息檢索、文本分類、聚類和語義相似度計算等多種自然語言處理任務。

模型特點

多任務支持
支持多種 NLP 任務,包括句子相似度、信息檢索、文本分類和聚類等。
高性能
在多個基準測試數據集上表現出色,如 MTEB、BEIR 等。
靈活的嵌入向量
能夠生成高質量的文本嵌入向量,適用於各種下游任務。

模型能力

句子相似度計算
信息檢索
文本分類
文本聚類
語義相似度評估
提示檢索
文本重排序

使用案例

信息檢索
文檔檢索
使用 INSTRUCTOR 嵌入向量進行高效的文檔檢索。
在 CQADupstack 數據集上表現出色,平均精度@10 達到 38.1365。
文本分類
情感分析
使用 INSTRUCTOR 進行文本情感分類。
在 AmazonPolarity 數據集上準確率達到 91.526%。
語義相似度
句子相似度計算
計算兩個句子之間的語義相似度。
在 BIOSSES 數據集上餘弦相似度斯皮爾曼相關係數達到 84.387。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase