DistilBERTオープンソーステキスト分類モデル - 性能はBERTに近く、小サイズで高速推論体験

ホーム

Distilbert Base Uncased Mnli

typeformによって開発

DistilBERTはBERTの軽量版で、BERTの97%の性能を維持しながら、サイズを40%削減し、速度を60%向上させています。

大規模言語モデル

Transformers

英語#ゼロショット分類 #多言語理解 #軽量BERT

ダウンロード数 74.81k

リリース時間 : 3/2/2022

モデル概要

DistilBERTはBERTベースの軽量モデルで、知識蒸留技術を用いて訓練され、様々な自然言語処理タスクに適しています。

モデル特徴

軽量で効率的

オリジナルのBERTモデルと比較して、サイズが40%削減され、推論速度が60%向上

高性能

BERTモデルの97%の性能を維持

マルチタスク対応

様々な自然言語処理タスクに適用可能

モデル能力

テキスト分類

ゼロショット分類

自然言語理解

使用事例

テキスト分析

感情分析

テキストの感情傾向を分析

高精度な感情分類

トピック分類

テキストを事前定義されたカテゴリに分類

カスタマーサービス

意図認識

ユーザークエリの意図を識別

🚀 DistilBERT base model (uncased)

DistilBERTのベースモデル（大文字小文字を区別しない）を使用したゼロショット分類モデルです。

🚀 クイックスタート

このコードを実行することで、DistilBERTのモデルを使用してゼロショット分類を行うことができます。

from transformers import AutoTokenizer, AutoModelForSequenceClassification

tokenizer = AutoTokenizer.from_pretrained("typeform/distilbert-base-uncased-mnli")

model = AutoModelForSequenceClassification.from_pretrained("typeform/distilbert-base-uncased-mnli")

✨ 主な機能

このモデルは、テキスト分類タスクに使用できます。

📚 ドキュメント

🔍 モデルの詳細

モデルの説明: これは、大文字小文字を区別しないDistilBERTモデルを Multi-Genre Natural Language Inference (MNLI) データセットでファインチューニングした、ゼロショット分類タスク用のモデルです。

開発者: Typeform チーム
モデルの種類: ゼロショット分類
言語: 英語
ライセンス: 不明
親モデル: Distilled-BERTベースモデルの詳細については、distilbert base uncased model を参照してください。

⚠️ リスク、制限事項、バイアス

コンテンツ警告: このセクションには、不快な内容や攻撃的な内容、歴史的および現在のステレオタイプを広める内容が含まれています。

多くの研究が、言語モデルのバイアスと公平性の問題を探っています（例えば、Sheng et al. (2021) および Bender et al. (2021) を参照）。

🔧 学習について

学習データ

この大文字小文字を区別しないDistilBERTモデルは、Multi-Genre Natural Language Inference (MultiNLI) コーパスで事前学習されています。これは、テキスト的含意情報で注釈付けされた433kの文ペアのクラウドソーシングされたコレクションです。このコーパスは、口頭および書面の様々なジャンルのテキストをカバーしており、独自のクロスジャンル汎化評価をサポートしています。

このモデルは、大文字小文字を区別しません。つまり、"english" と "English" を区別しません。

学習手順

学習は、次のハイパーパラメータを使用して p3.2xlarge AWS EC2上で行われます。

$ run_glue.py \
    --model_name_or_path distilbert-base-uncased \
    --task_name mnli \
    --do_train \
    --do_eval \
    --max_seq_length 128 \
    --per_device_train_batch_size 16 \
    --learning_rate 2e-5 \
    --num_train_epochs 5 \
    --output_dir /tmp/distilbert-base-uncased_mnli/