I

Instructor Large

由hkunlp開發
INSTRUCTOR 是一個基於 T5 架構的文本嵌入模型,專注於句子相似度計算和文本分類任務,支持英語語言處理。
下載量 186.12k
發布時間 : 12/20/2022

模型概述

該模型主要用於文本嵌入、句子相似度計算、信息檢索和文本分類等任務,在多個基準測試中表現出色。

模型特點

多任務支持
支持多種文本處理任務,包括句子相似度、文本分類、信息檢索和文本聚類。
高性能
在多個基準測試數據集上表現出色,如 MTEB 和 BEIR 數據集。
靈活的文本嵌入
能夠生成高質量的文本嵌入,適用於各種下游任務。

模型能力

文本嵌入
句子相似度計算
信息檢索
文本分類
文本聚類
文本重排序
特徵提取

使用案例

電子商務
產品評論分類
對亞馬遜產品評論進行情感分析(正面/負面)分類。
在 MTEB AmazonPolarityClassification 數據集上準確率達到 91.53%。
反事實評論檢測
識別亞馬遜上的反事實評論。
在 MTEB AmazonCounterfactualClassification 數據集上準確率達到 88.13%。
客戶服務
銀行問題分類
對銀行客戶問題進行分類。
在 MTEB Banking77Classification 數據集上準確率達到 78.51%。
學術研究
學術論文聚類
對 arXiv 和 bioRxiv 上的學術論文進行主題聚類。
在 arXiv 論文聚類任務上 V-measure 達到 43.16%。
問答系統
問答檢索
在技術問答社區中檢索相關問題。
在 AskUbuntuDupQuestions 數據集上平均精度達到 64.30%。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase