M

Msmarco Portuguese Mt5 Base V1

doc2queryによって開発
mT5ベースのdoc2queryモデル、ドキュメント拡張とドメイン固有トレーニングデータ生成用
ダウンロード数 44
リリース時間 : 4/29/2022

モデル概要

このモデルはmT5アーキテクチャに基づいており、段落から20〜40のクエリを生成し、ドキュメント拡張または埋め込みモデルのトレーニングデータ生成に使用できます。

モデル特徴

ドキュメント拡張
段落から20〜40のクエリを生成し、検索エンジンインデックスの効果を強化
トレーニングデータ生成
高性能な密埋め込みモデルのトレーニング用に(クエリ、テキスト)ペアを生成可能
多言語サポート
mT5アーキテクチャベースでポルトガル語処理をサポート

モデル能力

テキスト生成
クエリ生成
ドキュメント拡張

使用事例

情報検索
検索エンジン強化
生成されたクエリを元の段落と共にインデックス化し、BM25検索効果を向上
BEIR論文でBM25+docT5queryが強力な検索エンジンとして検証済み
機械学習トレーニング
埋め込みモデルトレーニング
ラベル付けされていないテキストセットに対して(クエリ、テキスト)ペアを生成し、密埋め込みモデルのトレーニングに使用
GPL論文とSBERT.netの例で有効性が示されている
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase