L

Longformer Base 4096 Sentence Transformers All Nli Stsb Quora Nq

Leo1212によって開発
これは、allenai/longformer-base-4096を微調整したsentence-transformersモデルで、文章や段落の768次元の密集ベクトル表現を生成するために使用され、意味的テキスト類似度、意味的検索などのタスクに適しています。
ダウンロード数 45
リリース時間 : 4/25/2025

モデル概要

このモデルは、文章や段落を768次元の密集ベクトル空間にマッピングし、意味的テキスト類似度、意味的検索、复述マイニング、テキスト分類、クラスタリングなどのタスクに使用できます。

モデル特徴

長文処理能力
Longformerアーキテクチャに基づいており、最大4098トークンのシーケンス長をサポートし、長い文書や段落の処理に適しています。
多タスク訓練
複数のデータセット(all-nli、stsb、quora、natural-questions)で連合訓練を行い、モデルの汎化能力を強化しました。
多損失関数最適化
MultipleNegativesRankingLoss、SoftmaxLoss、CoSENTLossなどの複数の損失関数を使用して最適化を行い、異なるタスクでの性能を向上させます。

モデル能力

意味的テキスト類似度計算
意味的検索
复述マイニング
テキスト分類
テキストクラスタリング
特徴抽出

使用事例

情報検索
類似質問のマッチング
質問応答システムで、ユーザーの質問と意味的に類似した質問を検索する
Quoraなどのプラットフォーム上の重複質問を正確にマッチングできます。
コンテンツ推薦
関連コンテンツの推薦
コンテンツの類似度に基づいて記事や製品を推薦する
ユーザーの関与度と転換率を向上させることができます。
テキスト分析
テキストクラスタリング
大量の文書を意味的類似度に基づいてグループ化する
トピックモデリングや文書組織化に使用できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase