paraphrase-multilingual-mpnet-base-v2-embedding-allオープンソースモデル - 無料で英語とドイツ語の文章の類似度を計算し、テキスト埋め込みを行う

ホーム

Paraphrase Multilingual Mpnet Base V2 Embedding All

LLukas22によって開発

このモデルはparaphrase-multilingual-mpnet-base-v2をファインチューニングしたバージョンで、英語とドイツ語の文の類似度計算をサポートし、多言語テキスト埋め込みタスクに適しています。

テキスト埋め込み

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #多言語文埋め込み #質問応答システムの最適化 #高精度な意味マッチング

ダウンロード数 28

リリース時間 : 2/23/2023

モデル概要

このモデルは主に文の類似度計算と特徴抽出に使用され、複数のデータセットでファインチューニングされ、高品質な文埋め込み表現を生成することができます。

モデル特徴

多言語対応

英語とドイツ語の文の類似度計算と特徴抽出をサポートします

高品質な埋め込み

複数の高品質なデータセットでファインチューニングされ、正確な文埋め込み表現を生成することができます

効率的なトレーニング

混合精度トレーニングとD-Adaptation最適化技術を採用し、トレーニング効率が高いです

モデル能力

文の類似度計算

テキスト特徴抽出

多言語テキスト処理

使用事例

情報検索

質問応答システム

質問応答システムの構築に使用でき、質問と関連する回答をマッチングします

評価でtop_1の正解率が32.4%に達しました

文書検索

クエリに最も関連する文書を検索するために使用されます

評価でtop_10の正解率が50.1%に達しました

テキスト分析

テキストクラスタリング

意味的に類似したテキストをクラスタリングしてグループ化するために使用できます

🚀 paraphrase-multilingual-mpnet-base-v2-embedding-all

このモデルは、paraphrase-multilingual-mpnet-base-v2 を以下のデータセットでファインチューニングしたバージョンです。squad、newsqa、LLukas22/cqadupstack、LLukas22/fiqa、LLukas22/scidocs、deepset/germanquad、LLukas22/nq。

🚀 クイックスタート

📦 インストール

sentence-transformers をインストールすると、このモデルを簡単に使用できます。

pip install -U sentence-transformers

💻 使用例

基本的な使用法

from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]

model = SentenceTransformer('LLukas22/paraphrase-multilingual-mpnet-base-v2-embedding-all')
embeddings = model.encode(sentences)
print(embeddings)

📚 詳細ドキュメント

🔧 技術詳細

トレーニングのハイパーパラメータ

トレーニング中に使用されたハイパーパラメータは以下の通りです。

学習率: 1E+00
デバイスごとのバッチサイズ: 40
実効的なバッチサイズ: 120
シード: 42
オプティマイザ: AdamW（ベータ (0.9,0.999)、イプシロン 1E-08）
重み減衰: 2E-02
D-Adaptation: True
ウォームアップ: True
エポック数: 15
混合精度トレーニング: bf16

トレーニング結果

エポック	トレーニング損失	検証損失
0	0.085	0.0625
1	0.0598	0.0554
2	0.0484	0.0518
3	0.0405	0.0485
4	0.0341	0.0463
5	0.0287	0.0454
6	0.0243	0.0445
7	0.0207	0.0426
8	0.0177	0.0424
9	0.0153	0.0421
10	0.0134	0.0417
11	0.012	0.0411
12	0.011	0.0414

評価結果

エポック	top_1	top_3	top_5	top_10	top_25
0	0.261	0.351	0.384	0.422	0.459
1	0.272	0.365	0.4	0.439	0.477
2	0.276	0.37	0.404	0.443	0.481
3	0.292	0.391	0.426	0.465	0.503
4	0.295	0.395	0.431	0.47	0.51
5	0.299	0.4	0.437	0.476	0.514
6	0.306	0.404	0.44	0.478	0.515
7	0.309	0.41	0.445	0.485	0.521
8	0.31	0.411	0.448	0.487	0.524
9	0.315	0.417	0.454	0.493	0.529
10	0.319	0.42	0.457	0.495	0.53
11	0.323	0.424	0.46	0.497	0.531
12	0.324	0.427	0.464	0.501	0.536