Instructor Base
T5アーキテクチャに基づくテキスト埋め込みモデルで、文の類似性計算とテキスト検索タスクに特化しており、複数のベンチマークテストで優れた性能を発揮します。
ダウンロード数 13.22k
リリース時間 : 12/20/2022
モデル概要
このモデルはT5アーキテクチャに基づくテキスト埋め込みモデルで、高品質な文埋め込みベクトルの生成を主な目的としており、情報検索、テキスト分類、クラスタリング、意味的類似性計算など、さまざまな自然言語処理タスクをサポートします。
モデル特徴
優れたマルチタスク性能
MTEBベンチマークテストの複数のタスク(分類、クラスタリング、検索タスクなど)で優れた性能を発揮
効率的なテキスト埋め込み
大規模な情報検索シナリオに適した高品質な文埋め込みベクトルを生成可能
幅広い適用性
類似性計算、分類、クラスタリングなど、さまざまな下流NLPタスクをサポート
モデル能力
文の類似性計算
テキスト埋め込み生成
情報検索
テキスト分類
テキストクラスタリング
意味的検索
テキスト再ランキング
使用事例
電子商取引
製品レビュー分類
Amazon製品レビューの感情分析分類
AmazonPolarity分類タスクで88.36%の精度を達成
反事実検出
Amazon製品レビュー中の反事実的記述を識別
AmazonCounterfactual分類タスクで86.21%の精度を達成
金融
銀行カスタマーサポート分類
銀行の顧客問い合わせを分類
Banking77分類タスクで77.04%の精度を達成
学術研究
論文クラスタリング
arXivとbiorxivの論文を主題別にクラスタリング
ArxivClusteringP2Pタスクで39.68 v_measureスコアを達成
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98