V

Vectorizer V1 S Multilingual

sinequaによって開発
Sinequaが開発した多言語ベクトル化ツールで、入力された段落やクエリに対して埋め込みベクトルを生成し、類似度計算や情報検索に使用されます。
ダウンロード数 322
リリース時間 : 7/10/2023

モデル概要

このモデルはBERT-Smallアーキテクチャに基づく多言語特徴抽出器で、主に文の類似度計算や情報検索タスクに使用され、英語、フランス語、ドイツ語、スペイン語の4言語をサポートしています。

モデル特徴

多言語サポート
英語、フランス語、ドイツ語、スペイン語の4言語のテキスト処理をサポート
効率的な推論
様々なGPUで効率的な推論速度を発揮し、FP16量子化下で32サンプルのバッチ処理にわずか5ミリ秒を要します
大文字小文字を区別しない
テキストの大文字小文字やアクセントに敏感ではなく、検索の堅牢性を向上させます
バッチ内ネガティブサンプル訓練
クエリ-段落ペアとバッチ内ネガティブサンプルを用いた訓練方法でベクトル表現を最適化

モデル能力

テキストベクトル化
多言語テキスト処理
意味的類似度計算
情報検索

使用事例

情報検索
ドキュメント検索システム
意味的類似度に基づくドキュメント検索システムの構築
BEIRベンチマークテストで平均Recall@100が0.448を達成
多言語質問応答システム
複数言語をサポートする質問応答システムのバックエンド
MIRACLベンチマークテストでフランス語のRecall@100が0.583を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase