distilbert-similarity-b32-3オープンソースモデル - 無料で文の意味検索とクラスタリングタスクを実現

ホーム

Distilbert Similarity B32 3

shafinによって開発

これはDistilBERTアーキテクチャに基づく文類似度計算モデルで、文や段落を3次元ベクトル空間にマッピングでき、意味検索やクラスタリングタスクに適しています。

テキスト埋め込み

PyTorch

#文類似度 #3次元ベクトル #軽量BERT

ダウンロード数 41

リリース時間 : 6/26/2022

モデル概要

このモデルはsentence-transformersフレームワークを使用して構築され、文や段落間の類似度計算に特化しています。テキストを低次元ベクトル空間にマッピングすることで、効率的に意味比較やクラスタ分析が可能です。

モデル特徴

低次元ベクトル空間

テキストを3次元ベクトル空間にマッピングし、効率的な計算と可視化を可能にする

軽量アーキテクチャ

DistilBERTベースの軽量アーキテクチャで、性能を維持しながら計算リソース要件を低減

意味理解

表面的な特徴だけでなく、文の意味情報を捉えることができる

モデル能力

文類似度計算

テキストクラスタリング

意味検索

特徴抽出

使用事例

情報検索

類似ドキュメント検索

ドキュメントライブラリ内で意味的に類似したドキュメントを検索

検索精度と効率の向上

テキスト分析

テキストクラスタリング

意味的に類似したテキストを自動的にグループ化

トピック発見とコンテンツ整理の容易化

🚀 shafin/distilbert-similarity-b32-3

このモデルはsentence-transformersを使用しており、文章や段落を3次元の密ベクトル空間にマッピングします。クラスタリングや意味検索などのタスクに使用できます。

🚀 クイックスタート

このモデルを使用するには、sentence-transformersをインストールする必要があります。

📦 インストール

pip install -U sentence-transformers

💻 使用例

基本的な使用法

from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]

model = SentenceTransformer('shafin/distilbert-similarity-b32-3')
embeddings = model.encode(sentences)
print(embeddings)

📚 ドキュメント

評価結果

このモデルの自動評価については、Sentence Embeddings Benchmarkを参照してください: https://seb.sbert.net

学習

このモデルは以下のパラメータで学習されました。

DataLoader: torch.utils.data.dataloader.DataLoader (長さ: 56250) で、以下のパラメータが使用されました。

{'batch_size': 16, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}

損失関数: sentence_transformers.losses.OnlineContrastiveLoss.OnlineContrastiveLoss

fit()メソッドのパラメータ:

{
    "epochs": 3,
    "evaluation_steps": 0,
    "evaluator": "NoneType",
    "max_grad_norm": 1,
    "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
    "optimizer_params": {
        "lr": 2e-05
    },
    "scheduler": "WarmupLinear",
    "steps_per_epoch": null,
    "warmup_steps": 5000,
    "weight_decay": 0.01
}

モデルの全アーキテクチャ

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: DistilBertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False})
  (2): Dense({'in_features': 768, 'out_features': 256, 'bias': True, 'activation_function': 'torch.nn.modules.activation.Tanh'})
  (3): Dense({'in_features': 256, 'out_features': 32, 'bias': True, 'activation_function': 'torch.nn.modules.activation.Tanh'})
  (4): Dense({'in_features': 32, 'out_features': 3, 'bias': True, 'activation_function': 'torch.nn.modules.activation.Tanh'})
)