gbert-large-paraphrase-euclidean開源德語句子嵌入模型

首頁

Gbert Large Paraphrase Euclidean

由deutsche-telekom開發

基於sentence-transformers的德語句子嵌入模型，將文本映射到1024維向量空間，專為小樣本分類優化

文本嵌入

Transformers

德語開源協議:MIT #德語句子相似度 #歐式距離優化 #小樣本學習

下載量 19.03k

發布時間 : 1/13/2023

模型概述

該模型是基於deepset/gbert-large構建的德語句子嵌入模型，使用歐式距離作為相似度度量，特別設計用於與SetFit結合提升德語小樣本分類性能。

模型特點

歐式距離優化

使用BatchHardSoftMarginTripletLoss配合歐式距離進行訓練，適合特定距離度量需求

高質量訓練數據

基於嚴格篩選的德語回譯和釋義數據集，確保訓練質量

小樣本優化

特別設計用於提升德語小樣本場景下的文本分類性能

孿生模型支持

提供餘弦相似度版本作為互補選擇（deutsche-telekom/gbert-large-paraphrase-cosine）

模型能力

德語文本嵌入

句子相似度計算

小樣本學習

文本分類支持

使用案例

文本分類

小樣本分類任務

在標註數據有限的情況下進行德語文本分類

在NLU小樣本基準測試中表現優異

語義搜索

德語文檔檢索

基於語義相似度的德語文檔搜索系統

🚀 德語BERT大模型釋義歐幾里得模型

這是一個 sentence-transformers 模型，它可以將句子和段落（文本）映射到一個1024維的密集向量空間中。該模型旨在與 SetFit 一起使用，以改進德語少樣本的文本分類任務。它有一個兄弟模型 deutsche-telekom/gbert-large-paraphrase-cosine。

此模型基於 deepset/gbert-large 構建，非常感謝 deepset！

🚀 快速開始

該模型可用於德語少樣本的文本分類任務，結合 SetFit 能取得更好的效果。

✨ 主要特性

基於 sentence-transformers 框架，可將文本映射到1024維的密集向量空間。
與 SetFit 結合使用，提升德語少樣本的文本分類性能。
有一個兄弟模型 deutsche-telekom/gbert-large-paraphrase-cosine。

🔧 技術細節

訓練

損失函數

我們使用了 BatchHardSoftMarginTripletLoss 作為損失函數，並採用歐幾里得距離：

    train_loss = losses.BatchHardSoftMarginTripletLoss(
       model=model,
       distance_metric=BatchHardTripletLossDistanceFunction.eucledian_distance,
   )