B

Bert Base 1024 Biencoder 64M Pairs

shreyansh26によって開発
MosaicMLで事前学習された1024シーケンス長BERTに基づく長文コンテキスト用デュアルエンコーダー、文と段落の埋め込み用
ダウンロード数 19
リリース時間 : 8/22/2023

モデル概要

このモデルは文と段落を768次元の密ベクトル空間にマッピングし、クラスタリングや意味検索などのタスクに使用できます。

モデル特徴

長文コンテキストサポート
1024シーケンス長をサポート、長文ドキュメントや段落の処理に適している
大規模トレーニング
64Mのランダムサンプリングされた文/段落ペアでトレーニング済み
効率的な検索
意味検索や情報検索タスクに最適化

モデル能力

文埋め込み
段落埋め込み
意味類似性計算
情報検索
ドキュメントクラスタリング

使用事例

情報検索
意味検索
検索エンジンの意味検索機能を構築
複数の検索ベンチマークで良好なパフォーマンス
質問応答システム
質問に最も関連するドキュメント段落を検索
テキスト分析
ドキュメントクラスタリング
類似内容のドキュメントをグループ化
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase