🚀 多語言句子嵌入模型 paraphrase-multilingual-mpnet-base-v2-embedding-all
本模型是 paraphrase-multilingual-mpnet-base-v2 的微調版本,在以下數據集上進行了微調:squad、newsqa、LLukas22/cqadupstack、LLukas22/fiqa、LLukas22/scidocs、deepset/germanquad、LLukas22/nq。該模型可用於句子相似度計算等任務。
🚀 快速開始
本模型可以藉助 sentence-transformers 庫輕鬆使用。
📦 安裝指南
首先,確保你已經安裝了 sentence-transformers
庫,可使用以下命令進行安裝:
pip install -U sentence-transformers
💻 使用示例
基礎用法
安裝完成後,你可以按照以下示例代碼使用該模型:
from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]
model = SentenceTransformer('LLukas22/paraphrase-multilingual-mpnet-base-v2-embedding-all')
embeddings = model.encode(sentences)
print(embeddings)
🔧 技術細節
訓練超參數
以下是訓練過程中使用的超參數:
- 學習率(learning_rate):1E+00
- 每個設備的批量大小(per device batch size):40
- 有效批量大小(effective batch size):120
- 隨機種子(seed):42
- 優化器(optimizer):AdamW,β值為 (0.9, 0.999),ε值為 1E-08
- 權重衰減(weight decay):2E-02
- D 自適應(D-Adaptation):True
- 熱身(Warmup):True
- 訓練輪數(number of epochs):15
- 混合精度訓練(mixed_precision_training):bf16
訓練結果
輪數(Epoch) |
訓練損失(Train Loss) |
驗證損失(Validation Loss) |
0 |
0.085 |
0.0625 |
1 |
0.0598 |
0.0554 |
2 |
0.0484 |
0.0518 |
3 |
0.0405 |
0.0485 |
4 |
0.0341 |
0.0463 |
5 |
0.0287 |
0.0454 |
6 |
0.0243 |
0.0445 |
7 |
0.0207 |
0.0426 |
8 |
0.0177 |
0.0424 |
9 |
0.0153 |
0.0421 |
10 |
0.0134 |
0.0417 |
11 |
0.012 |
0.0411 |
12 |
0.011 |
0.0414 |
評估結果
輪數(Epoch) |
前 1 準確率(top_1) |
前 3 準確率(top_3) |
前 5 準確率(top_5) |
前 10 準確率(top_10) |
前 25 準確率(top_25) |
0 |
0.261 |
0.351 |
0.384 |
0.422 |
0.459 |
1 |
0.272 |
0.365 |
0.4 |
0.439 |
0.477 |
2 |
0.276 |
0.37 |
0.404 |
0.443 |
0.481 |
3 |
0.292 |
0.391 |
0.426 |
0.465 |
0.503 |
4 |
0.295 |
0.395 |
0.431 |
0.47 |
0.51 |
5 |
0.299 |
0.4 |
0.437 |
0.476 |
0.514 |
6 |
0.306 |
0.404 |
0.44 |
0.478 |
0.515 |
7 |
0.309 |
0.41 |
0.445 |
0.485 |
0.521 |
8 |
0.31 |
0.411 |
0.448 |
0.487 |
0.524 |
9 |
0.315 |
0.417 |
0.454 |
0.493 |
0.529 |
10 |
0.319 |
0.42 |
0.457 |
0.495 |
0.53 |
11 |
0.323 |
0.424 |
0.46 |
0.497 |
0.531 |
12 |
0.324 |
0.427 |
0.464 |
0.501 |
0.536 |
框架版本
- Transformers:4.25.1
- PyTorch:2.0.0.dev20230210+cu118
- PyTorch Lightning:1.8.6
- Datasets:2.7.1
- Tokenizers:0.13.1
- Sentence Transformers:2.2.2
📚 詳細文檔
本模型是作者碩士論文 'Evaluation of transformer based language models for use in service information systems' 的一部分。源代碼可在 Github 上獲取。
📄 許可證
本模型採用 Apache-2.0 許可證。