Vectorizer V1 S En
V
Vectorizer V1 S En
sinequaによって開発
Sinequaによって開発されたベクトル化ツールで、段落やクエリから埋め込みベクトルを生成し、文の類似度計算や特徴抽出に使用されます。
ダウンロード数 304
リリース時間 : 7/10/2023
モデル概要
このモデルは段落やクエリを埋め込みベクトルに変換でき、段落ベクトルはベクトルインデックスに保存され、クエリベクトルはインデックス内の関連段落を検索するために使用されます。
モデル特徴
効率的なベクトル化
テキスト段落やクエリを256次元の埋め込みベクトルに迅速に変換できます
大文字小文字を区別しない
テキストの大文字小文字やアクセントに敏感ではなく、マッチング精度を向上させます
二段階トレーニング
バッチ内ネガティブサンプリング戦略とANCEバリアントの二段階トレーニングプロセスを採用し、モデル性能を最適化します
モデル能力
テキストベクトル化
文類似度計算
意味検索
使用事例
情報検索
ドキュメント検索
ドキュメントライブラリ内でクエリに最も関連する段落を検索します
BEIRベンチマークテストで平均Recall@100が0.456を達成しました
質問応答システム
段落ベースの質問応答
ベクトル類似度マッチングを通じて、答えを含む可能性が最も高い段落を見つけます
Natural QuestionsデータセットでRecall@100が0.671を達成しました
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98