B

Bert Base 1024 Biencoder 64M Pairs

Developed by shreyansh26
MosaicMLで事前学習された1024シーケンス長BERTに基づく長文コンテキスト用デュアルエンコーダー、文と段落の埋め込み用
Downloads 19
Release Time : 8/22/2023

Model Overview

このモデルは文と段落を768次元の密ベクトル空間にマッピングし、クラスタリングや意味検索などのタスクに使用できます。

Model Features

長文コンテキストサポート
1024シーケンス長をサポート、長文ドキュメントや段落の処理に適している
大規模トレーニング
64Mのランダムサンプリングされた文/段落ペアでトレーニング済み
効率的な検索
意味検索や情報検索タスクに最適化

Model Capabilities

文埋め込み
段落埋め込み
意味類似性計算
情報検索
ドキュメントクラスタリング

Use Cases

情報検索
意味検索
検索エンジンの意味検索機能を構築
複数の検索ベンチマークで良好なパフォーマンス
質問応答システム
質問に最も関連するドキュメント段落を検索
テキスト分析
ドキュメントクラスタリング
類似内容のドキュメントをグループ化
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase