B

Bloomz 560m Retriever V2

cmarkeaによって開発
Bloomz-560m-dpo-chatモデルを基にしたデュアルエンコーダで、記事とクエリを同一のベクトル空間にマッピングし、フランス語と英語の多言語検索をサポートします。
ダウンロード数 17
リリース時間 : 5/26/2024

モデル概要

このモデルはオープンドメイン質問応答(ODQA)タスク向けに特別設計されたデュアルエンコーダで、クエリと関連記事を同一のベクトル空間にマッピングし、クエリと関連記事の近接性を確保します。フランス語と英語の多言語検索をサポートします。

モデル特徴

多言語検索
フランス語と英語の多言語検索をサポートし、記事がフランス語でも英語でも、どちらの言語のクエリでも関連記事を見つけられます。
効率的な検索
コサイン距離を指標として採用し、検索効率を大幅に向上させます。
対照学習トレーニング
改良版mMARCOデータセットを使用した対照学習トレーニングを実施し、偽陰性サンプルをフィルタリングして困難な負例戦略を採用しています。

モデル能力

特徴量抽出
多言語検索
オープンドメイン質問応答

使用事例

情報検索
オープンドメイン質問応答
オープンドメイン質問応答システムで、質問に答えるための関連記事を迅速に検索します。
SQuADテストセットで優れた性能を発揮し、Top-1精度は68%(仏/仏)と66.6%(英/仏)を達成しました。
多言語ドキュメント検索
フランス語と英語間の多言語ドキュメント検索をサポートします。
多言語検索タスクにおいて、従来のBM25やCamemBERTなどのモデルを上回る性能を示しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase