A

All Mpnet Base V2

navtecaによって開発
これはMPNetアーキテクチャに基づく文埋め込みモデルで、テキストを768次元ベクトル空間にマッピングでき、意味検索や文類似度タスクに適しています。
ダウンロード数 14
リリース時間 : 3/2/2022

モデル概要

このモデルは自己教師あり対照学習により10億以上の文ペアデータセットで訓練され、文や段落を密なベクトル表現に変換でき、クラスタリング、意味検索などのNLPタスクをサポートします。

モデル特徴

大規模訓練データ
10億以上の文ペアを使用して訓練され、多様なテキストタイプと分野をカバー
効率的な意味符号化
文や段落を768次元密ベクトルに変換し、意味情報を効果的に捕捉
対照学習最適化
対照学習目標を用いて微調整し、文類似度判断の精度を向上
TPU最適化訓練
7つのTPU v3-8で効率的に訓練され、Flax/JAXフレームワークの加速効果を享受

モデル能力

文ベクトル化
意味類似度計算
情報検索
テキストクラスタリング
特徴抽出

使用事例

情報検索
ドキュメント検索
クエリとドキュメントをベクトルに変換し、意味に基づくドキュメント検索を実現
キーワード検索に比べてクエリ意図をより良く理解可能
テキスト分析
文類似度計算
2つの文間の意味的類似度を計算
QAシステム、重複質問検出などのシナリオに利用可能
テキストクラスタリング
類似内容のテキストを自動的にグループ化
トピックモデリング、ユーザーフィードバック分析などに利用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase