dense_encoder - distilbert - frozen_embオープンソース密集検索モデル

ホーム

Dense Encoder Distilbert Frozen Emb

vocab-transformersによって開発

DistilBERTアーキテクチャに基づく高密度検索モデルで、MS MARCOデータセットでトレーニングされ、単語埋め込み層は凍結状態を維持

テキスト埋め込み

Transformers

#情報検索最適化 #凍結単語埋め込み #MarginMSE損失

ダウンロード数 26

リリース時間 : 4/5/2022

モデル概要

このモデルはDistilBERTのバリエーションで、情報検索タスクに特化して最適化されており、MarginMSE損失関数を使用してトレーニングされ、ドキュメントとクエリの高密度ベクトル表現生成に適しています

モデル特徴

凍結単語埋め込みトレーニング

トレーニング中に事前トレーニングされた単語埋め込み層のパラメータを変更せず、モデルの安定性を向上させる可能性があります

MarginMSE最適化

MarginMSE損失関数を使用してトレーニングを行い、検索タスクのランキング性能を最適化

軽量アーキテクチャ

DistilBERTアーキテクチャに基づいており、元のBERTモデルよりも小さく高速で、良好な性能を維持

モデル能力

テキストベクトル表現

意味的類似度計算

情報検索

ドキュメントランキング

使用事例

検索エンジン

ウェブ検索結果ランキング

検索エンジン用にクエリとドキュメントの高密度ベクトル表現を生成し、関連性ランキングに使用

TREC-DLなどの標準検索評価で良好なパフォーマンス

質問応答システム

回答段落検索

大量のドキュメントから質問に関連する段落を迅速に検索

FiQAなどの金融質問応答データセットで安定したパフォーマンス

データセット	トークン埋め込みを更新したモデル	トークン埋め込みを凍結したモデル
TREC-DL 19	70.68	68.60
TREC-DL 20	67.69	70.21
FiQA	28.89	28.60
Robust04	39.56	39.08
TREC-COVID v2	69.80	69.84
TREC-NEWS	37.97	38.27
Avg. 4 BEIR tasks	44.06	43.95

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Dense Encoder Distilbert Frozen Emb

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Dense Encoder - Distilbert - Frozen Token Embeddings

🚀 クイックスタート