contradiction - miniオープンソース特許矛盾文識別モデル、クラスタリングと意味検索タスクに無料で使用できます

ホーム

Contradiction Mini

nategroによって開発

all - MiniLM - L6 - v2に基づく特許矛盾文識別モデルで、文や段落を384次元の密ベクトル空間にマッピングでき、クラスタリングや意味的検索などのタスクに適しています。

テキスト埋め込み

PyTorch

#特許矛盾識別 #文のベクトル化 #意味的類似度

ダウンロード数 18

リリース時間 : 10/13/2022

モデル概要

これはsentence - transformersに基づくモデルで、特許内の矛盾する文を識別するために専用に設計されています。テキストを384次元のベクトル表現に変換し、文の類似度計算や意味分析を行いやすくします。

モデル特徴

特許矛盾文識別

特許テキストに特化して最適化された矛盾文識別能力

384次元ベクトル空間

文や段落を384次元の密ベクトル空間にマッピングする

MiniLMアーキテクチャに基づく

効率的なall - MiniLM - L6 - v2モデルアーキテクチャに基づく

モデル能力

文の類似度計算

意味的検索

テキストクラスタリング

特許テキスト分析

使用事例

特許分析

特許矛盾検出

特許文書内の矛盾する記述を識別する

特許審査の効率と精度を向上させる

情報検索

意味的検索

意味的類似度に基づく特許文書の検索

より正確な検索結果

🚀 contradiction - mini

このモデルは、all - MiniLM - L6 - v2 を使用して、特許文書内の矛盾文を識別するためのものです。これは sentence - transformers モデルで、文章や段落を384次元の密ベクトル空間にマッピングし、クラスタリングや意味検索などのタスクに使用できます。

🚀 クイックスタート

このモデルを使用するには、sentence - transformers をインストールする必要があります。

✨ 主な機能

特許文書内の矛盾文を識別することができます。
文章や段落を384次元の密ベクトル空間にマッピングし、クラスタリングや意味検索などのタスクに使用できます。

📦 インストール

pip install -U sentence-transformers

💻 使用例

基本的な使用法

from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]

model = SentenceTransformer('nategro/contradiction-mini')
embeddings = model.encode(sentences)
print(embeddings)

📚 ドキュメント

評価結果

このモデルの自動評価については、Sentence Embeddings Benchmark を参照してください: https://seb.sbert.net

学習

このモデルは以下のパラメータで学習されました。

DataLoader: torch.utils.data.dataloader.DataLoader (長さ496) で、以下のパラメータが設定されています。

{'batch_size': 16, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}

損失関数: sentence_transformers.losses.CosineSimilarityLoss.CosineSimilarityLoss

fit() メソッドのパラメータ:

{
    "epochs": 1,
    "evaluation_steps": 0,
    "evaluator": "NoneType",
    "max_grad_norm": 1,
    "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
    "optimizer_params": {
        "lr": 2e-05
    },
    "scheduler": "WarmupLinear",
    "steps_per_epoch": 496,
    "warmup_steps": 50,
    "weight_decay": 0.01
}

モデルの完全なアーキテクチャ

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False})
  (2): Normalize()
)