I

Instructor Base

由hkunlp開發
基於T5架構的文本嵌入模型,專注於句子相似度計算和文本檢索任務,在多個基準測試中表現優異。
下載量 13.22k
發布時間 : 12/20/2022

模型概述

該模型是一個基於T5架構的文本嵌入模型,主要用於生成高質量的句子嵌入向量,支持信息檢索、文本分類、聚類和語義相似度計算等多種自然語言處理任務。

模型特點

多任務性能優異
在MTEB基準測試的多個任務中表現優秀,包括分類、聚類和檢索任務
高效文本嵌入
能夠生成高質量的句子嵌入向量,適用於大規模信息檢索場景
廣泛適用性
支持多種下游NLP任務,包括相似度計算、分類和聚類等

模型能力

句子相似度計算
文本嵌入生成
信息檢索
文本分類
文本聚類
語義搜索
文本重排序

使用案例

電子商務
產品評論分類
對亞馬遜產品評論進行情感分析分類
在AmazonPolarity分類任務中達到88.36%準確率
反事實檢測
識別亞馬遜產品評論中的反事實陳述
在AmazonCounterfactual分類任務中達到86.21%準確率
金融
銀行客服分類
對銀行客戶諮詢進行分類
在Banking77分類任務中達到77.04%準確率
學術研究
論文聚類
對arXiv和biorxiv論文進行主題聚類
在ArxivClusteringP2P任務中達到39.68 v_measure分數
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase