scibert - nliオープンソースモデル - 無料で利用可能、汎用的な文の埋め込みを生成する良いツール

ホーム

Scibert Nli

gsartiによって開発

SciBERTモデルを基に、SNLIとMultiNLIデータセットでファインチューニングされ、汎用文埋め込み生成用に設計されたモデル

テキスト埋め込み #科学テキスト埋め込み #NLIファインチューニング #文類似度

ダウンロード数 13.77k

リリース時間 : 3/2/2022

モデル概要

このモデルはSciBERTアーキテクチャを基盤とし、自然言語推論データセットでファインチューニングされており、科学テキスト処理タスクに適した高品質な文埋め込みを生成できます。

モデル特徴

科学テキスト最適化

基礎モデルとしてSciBERTを使用し、科学テキストに特化して最適化されています

効率的なトレーニング

NVIDIA Tesla P100 GPU上で約4時間でトレーニングが完了します

平均プーリング戦略

文埋め込み生成に平均プーリング戦略を採用し、表現力を向上させています

モデル能力

文埋め込み生成

テキスト類似度計算

科学テキスト処理

使用事例

情報検索

科学論文検索

類似性に基づく科学論文検索システム

Covid Papers Browserプロジェクトで応用されました

テキスト分析

文類似度計算

2つの科学テキスト文間の意味的類似度を計算

STSデータセットで74.50のSpearman相関係数を達成

🚀 SciBERT-NLI

SciBERT-NLI は、SciBERT [1] モデルをファインチューニングして得られたものです。このモデルは、SNLI と MultiNLI データセットで訓練され、sentence-transformers ライブラリを使って汎用的な文埋め込みを生成します [2]。本モデルは、科学論文の検索などの自然言語処理タスクに利用できます。

🚀 クイックスタート

このモデルは、元の scivocab トークンボキャブラリを使用し、平均プーリング戦略とソフトマックス損失関数を用いて訓練されています。

✨ 主な機能

事前学習済みの SciBERT モデルをベースにしており、科学テキスト処理で良好な性能を発揮します。
SNLI と MultiNLI データセットを利用してファインチューニングされ、汎用的な文埋め込みを生成します。
平均プーリング戦略とソフトマックス損失関数を採用し、モデルの訓練効果を保証します。

💻 使用例

Covid Papers Browser リポジトリには、類似度に基づく科学論文検索の使用例が提供されています。

📚 ドキュメント

モデル情報

属性	詳細
ベースモデル	HuggingFace の `AutoModel` 内の `allenai/scibert-scivocab-cased`
訓練時間	Kaggle Notebooks が提供する NVIDIA Tesla P100 GPU 上で約 4 時間訓練
訓練パラメータ
バッチサイズ	64
訓練ステップ数	20000
ウォームアップステップ数	1450
小文字変換	True
最大シーケンス長	128