A

All Datasets V4 MiniLM L6

flax-sentence-embeddingsによって開発
MiniLMアーキテクチャに基づく軽量級文埋め込みモデルで、対比学習を通じて10億の文ペアデータセットで微調整され、意味類似度計算と情報検索タスクに適しています。
ダウンロード数 6,550
リリース時間 : 3/2/2022

モデル概要

このモデルは自己監督対比学習目標で訓練され、入力文を意味情報を含むベクトル表現にエンコードすることができ、主に文の類似度計算、情報検索、テキストクラスタリングなどのタスクに使用されます。

モデル特徴

大規模対比学習訓練
10億を超える文ペアの多様なデータセットで対比学習を微調整し、意味表現能力を強化します。
軽量級アーキテクチャ
6層のMiniLMアーキテクチャを採用し、性能を維持しながら計算リソースの要求を減らします。
多源データ融合
30以上の異なる分野のデータセット(質問応答、学術論文、コミュニティ討論など)を統合し、モデルの汎化能力を向上させます。

モデル能力

文のベクトル化
意味類似度計算
情報検索
テキストクラスタリング
意味検索

使用事例

情報検索
文書類似度マッチング
ユーザーのクエリと文書庫の意味類似度を計算します。
従来のキーワードマッチング方法に代わり、意味に基づく検索を実現できます。
質問応答システム
類似質問マッチング
質問応答コミュニティで自動的に意味が類似する質問を関連付けます。
重複質問を減らし、コミュニティ運営の効率を向上させます。
学術研究
論文推薦
論文のタイトル/要約の意味類似度に基づいて関連する研究を推薦します。
研究者が異分野の関連文献を発見するのに役立ちます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase