M

Msmarco Portuguese Mt5 Base V1

Developed by doc2query
mT5ベースのdoc2queryモデル、ドキュメント拡張とドメイン固有トレーニングデータ生成用
Downloads 44
Release Time : 4/29/2022

Model Overview

このモデルはmT5アーキテクチャに基づいており、段落から20〜40のクエリを生成し、ドキュメント拡張または埋め込みモデルのトレーニングデータ生成に使用できます。

Model Features

ドキュメント拡張
段落から20〜40のクエリを生成し、検索エンジンインデックスの効果を強化
トレーニングデータ生成
高性能な密埋め込みモデルのトレーニング用に(クエリ、テキスト)ペアを生成可能
多言語サポート
mT5アーキテクチャベースでポルトガル語処理をサポート

Model Capabilities

テキスト生成
クエリ生成
ドキュメント拡張

Use Cases

情報検索
検索エンジン強化
生成されたクエリを元の段落と共にインデックス化し、BM25検索効果を向上
BEIR論文でBM25+docT5queryが強力な検索エンジンとして検証済み
機械学習トレーニング
埋め込みモデルトレーニング
ラベル付けされていないテキストセットに対して(クエリ、テキスト)ペアを生成し、密埋め込みモデルのトレーニングに使用
GPL論文とSBERT.netの例で有効性が示されている
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase