Esci MiniLM L6 V2
これはsentence-transformersベースの文埋め込みモデルで、テキストを384次元のベクトル空間にマッピングし、セマンティック検索やクラスタリングタスクに適しています。
ダウンロード数 79
リリース時間 : 4/3/2023
モデル概要
このモデルはAmazon ESCIデータセットでファインチューニングされたMiniLM-L6-v2バージョンで、文の密なベクトル表現を生成し、セマンティック類似度計算や情報検索タスクをサポートするために特別に設計されています。
モデル特徴
効率的なベクトル表現
文や段落を384次元の密なベクトルに変換し、後続の類似度計算や検索を容易にする
ESCIデータセットでのファインチューニング
Amazon ESCIデータセットで特別にファインチューニングされ、EC分野のセマンティック理解能力を最適化
軽量モデル
MiniLM-L6-v2アーキテクチャに基づき、性能を維持しながら計算リソース要件を削減
モデル能力
文のベクトル化
セマンティック類似度計算
テキストクラスタリング
情報検索
使用事例
電子商取引
商品検索の関連性ランキング
クエリと商品説明のセマンティック類似度を計算して検索結果のランキングを改善
検索結果の関連性とユーザー体験の向上
類似商品推薦
商品説明のベクトル類似度に基づいて関連商品を発見
クロスセールとアップセールの機会増加
汎用テキスト処理
ドキュメントクラスタリング
類似コンテンツのドキュメントを自動的にグループ化
ドキュメント管理と情報整理の簡素化
セマンティック検索
キーワードマッチングを超えた深いセマンティック検索
より正確な検索結果の提供
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98