M

Modernbert Embed Base Ft Sts Spanish Matryoshka 768 64

mrm8488によって開発
これはmodernbert-embed-baseモデルをファインチューニングした文変換器で、文の埋め込みベクトルを生成し意味類似度を計算するために使用されます。
ダウンロード数 443
リリース時間 : 1/10/2025

モデル概要

このモデルは文や段落を768次元の密なベクトル空間にマッピングでき、意味的テキスト類似度、意味検索、言い換えマイニング、テキスト分類、クラスタリングなどのタスクに使用できます。

モデル特徴

高次元意味表現
テキストを768次元ベクトル空間にマッピングし、深層の意味的特徴を捉えることができます
多次元類似度計算
異なる次元(768/512/256/128/64)での意味類似度計算をサポートします
長文処理
最大8192トークンのシーケンス長に対応し、長文処理に適しています
効率的なファインチューニング
プライベートSTSデータセットでファインチューニングされ、意味類似度タスクのパフォーマンスが向上しています

モデル能力

意味的テキスト類似度計算
意味検索
言い換えマイニング
テキスト分類
テキストクラスタリング

使用事例

情報検索
類似ドキュメント検索
ドキュメントベクトルの類似度計算を通じて、関連ドキュメントを検索します
コンテンツ推薦
関連コンテンツ推薦
意味類似度に基づいてユーザーに関連コンテンツを推薦します
質問応答システム
類似質問マッチング
質問応答システムで意味的に類似した質問をマッチングします
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase