A

All Mpnet Base V2 Feature Extraction Pipeline

questgenによって開発
MPNetアーキテクチャに基づく文埋め込みモデルで、テキストを768次元ベクトル空間にマッピングし、意味検索や文の類似度計算に適しています
ダウンロード数 78
リリース時間 : 5/15/2022

モデル概要

このモデルは文変換器で、文や段落を768次元の密なベクトル表現に変換でき、情報検索、クラスタリング、意味的類似度計算などのタスクに適しています。

モデル特徴

効率的な意味エンコーディング
文や段落を768次元ベクトルに効率的にエンコードし、意味情報を保持します
大規模トレーニング
10億以上の文ペアのデータセットでトレーニングされ、豊富な意味関係を学習しています
対照学習の最適化
対照学習目標を用いて微調整し、文の類似度判断能力を向上させます
TPU最適化トレーニング
7つのTPU v3-8を使用して効率的にトレーニングされ、FlaxとJAXフレームワークの恩恵を受けています

モデル能力

文のベクトル化
意味的類似度計算
情報検索
テキストクラスタリング
段落エンコーディング

使用事例

情報検索
意味検索
クエリとドキュメントをベクトルに変換し、キーワードではなく意味に基づく検索を実現します
検索結果の関連性を向上させます
テキスト分析
ドキュメントクラスタリング
類似ドキュメントをグループ化し、トピックモデリングやコンテンツ分析に使用します
ドキュメントコレクション内のトピック構造を自動的に発見します
質問応答システム
質問マッチング
ユーザーの質問とナレッジベースの質問の類似度を計算します
質問応答システムの精度を向上させます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase