A

All Datasets V4 Mpnet Base

flax-sentence-embeddingsによって開発
mpnet-baseに基づく文埋め込みモデルで、自己教師付き対比学習を通じて10億の文ペアデータセットで訓練され、高品質の文の意味ベクトル表現を生成できます。
ダウンロード数 131
リリース時間 : 3/2/2022

モデル概要

このモデルは文埋め込み用に特別に設計されたエンコーダで、入力文を意味情報を含むベクトル表現に変換でき、情報検索、テキストクラスタリング、文の類似度計算などのタスクに適しています。

モデル特徴

大規模訓練データ
10億を超える文ペアの多様なデータセットで訓練され、質問応答、フォーラム討論、百科事典などのさまざまなテキストタイプが含まれています。
対比学習の最適化
自己教師付き対比学習の目標を採用し、正の文ペアを予測することで文の表現を最適化します。
高性能TPU訓練
7台のTPU v3 - 8で訓練され、Googleの技術チームのサポートを受けています。

モデル能力

文のベクトル化
意味類似度計算
情報検索
テキストクラスタリング

使用事例

情報検索
ドキュメント検索
クエリ文とドキュメントをベクトルに変換し、意味に基づくドキュメント検索を実現します。
テキスト分析
類似質問の識別
質問応答システムで意味的に類似した質問を識別します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase