V

Vectorizer.guava

sinequaによって開発
Sinequaによって開発されたベクトル化ツールで、入力された段落やクエリから埋め込みベクトルを生成し、文の類似度計算や検索タスクに使用されます。
ダウンロード数 204
リリース時間 : 10/9/2024

モデル概要

このモデルは多言語文埋め込みモデルで、テキスト段落やクエリを高次元ベクトルに変換し、類似コンテンツの保存や検索に使用できます。英語、フランス語、ドイツ語など11の主要言語に特に最適化されています。

モデル特徴

多言語サポート
11の主要言語をサポートするよう特別に訓練されており、ベースモデルが事前学習した91言語とも互換性があります
効率的な推論
NVIDIA A10 GPUでFP16モードの場合、単一クエリの処理にわずか1ms、32クエリの処理に5msしかかかりません
大文字小文字を区別しない
テキストの大文字小文字やアクセントに影響されず、検索の堅牢性を向上させます
次元削減処理
追加の密層により出力次元を256に削減し、ストレージと検索効率を最適化します

モデル能力

多言語テキストベクトル化
文類似度計算
意味的検索
言語間テキストマッチング

使用事例

情報検索
文書検索システム
意味に基づく文書検索システムを構築し、クエリ内容に最も関連する文書段落を返します
英語データセットでRecall@100が0.616を達成
多言語アプリケーション
言語間コンテンツ推薦
多言語ウェブサイト向けにコンテンツ推薦機能を提供し、異なる言語の類似コンテンツをマッチングします
繁体字中国語msmarcoデータセットでRecall@100が0.738を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase