bart-large-samsumオープンソース会話要約モデル - 無料でデプロイして会話テキスト要約生成を最適化

ホーム

Bart Large Samsum

linydubによって開発

BART-largeアーキテクチャに基づいて微調整された対話要約生成モデルで、SAMSumデータセットでトレーニングされ、対話テキストの要約に特化して最適化されています。

テキスト生成

Transformers

英語オープンソースライセンス:Apache-2.0 #対話要約 #効率的な微調整 #AzureML最適化

ダウンロード数 670

リリース時間 : 3/2/2022

モデル概要

このモデルは対話内容を自動的に簡潔な要約に変換することができ、カスタマーサービスの記録や会議の議事録などのシーンの自動化処理に適しています。

モデル特徴

効率的な対話要約

対話シーンに特化して最適化されており、対話の核心内容を正確に捉えることができます。

AzureMLトレーニング

Azure機械学習サービスを使用してトレーニングされ、8枚のNVIDIA V100 GPUが搭載されています。

環境にやさしい計算

トレーニング過程の炭素排出量はわずか0.0297キログラムで、CodeCarbonで監視されています。

即座に使用可能

簡単なHuggingFace pipelineインターフェースを提供し、統合が容易です。

モデル能力

対話テキストの理解

自動要約生成

多輪対話の処理

使用事例

カスタマーサービス自動化

カスタマーサービス対話要約

カスタマーサービスの対話の核心問題と解決策の要約を自動生成します。

ROUGE-Lスコア44.18

会議記録

会議議事録生成

多輪の会議討論を自動的に重要な決定ポイントの要約にまとめます。

平均で約30語の要約を生成

🚀 bart-large-samsum

このモデルは、MicrosoftのAzure Machine Learning Serviceを使用してトレーニングされました。facebook/bart-largeのチェックポイントからsamsumコーパスでファインチューニングされました。

🚀 クイックスタート

このモデルは、MicrosoftのAzure Machine Learning Serviceを使ってトレーニングされ、facebook/bart-largeのチェックポイントからsamsumコーパスでファインチューニングされました。以下に使い方を紹介します。

💻 使用例

基本的な使用法

from transformers import pipeline
summarizer = pipeline("summarization", model="linydub/bart-large-samsum")

input_text = '''
    Henry: Hey, is Nate coming over to watch the movie tonight?
    Kevin: Yea, he said he'll be arriving a bit later at around 7 since he gets off of work at 6. Have you taken out the garbage yet?
    Henry: Oh I forgot. I'll do that once I'm finished with my assignment for my math class.
    Kevin: Yea, you should take it out as soon as possible. And also, Nate is bringing his girlfriend.
    Henry: Nice, I'm really looking forward to seeing them again.
'''
summarizer(input_text)

📚 詳細ドキュメント

🔗 AzureMLでのファインチューニング

ファインチューニングプロセスの詳細情報（サンプルやベンチマークを含む）:
[Preview] https://github.com/linydub/azureml-greenai-txtsum

📊 リソース使用状況

これらの結果はAzure Monitor Metricsから取得されました。すべての実験はAzureMLの低優先度コンピュートクラスタで実行されました。

プロパティ	詳細
Region	US West 2
AzureML Compute SKU	STANDARD_ND40RS_V2
Compute SKU GPU Device	8 x NVIDIA V100 32GB (NVLink)
Compute Node Count	1
Run Duration	6m 48s
Compute Cost (Dedicated/LowPriority)	$2.50 / $0.50 USD
Average CPU Utilization	47.9%
Average GPU Utilization	69.8%
Average GPU Memory Usage	25.71 GB
Total GPU Energy Usage	370.84 kJ

*コンピュートコスト ($) は、実行時間、使用されたコンピュートノードの数、およびSKUの1時間あたりの価格から推定されます。最新のSKU価格はこちらで確認できます。

🌱 炭素排出量

これらの結果はCodeCarbonを使用して取得されました。炭素排出量はトレーニング実行時間のみから推定されています（セットアップと評価の実行時間は除外）。

プロパティ	詳細
timestamp	2021-09-16T23:54:25
duration	263.2430217266083
emissions	0.029715544634717518
energy_consumed	0.09985062041235725
country_name	USA
region	Washington
cloud_provider	azure
cloud_region	westus2

⚙️ ハイパーパラメータ

max_source_length: 512
max_target_length: 90
fp16: True
seed: 1
per_device_train_batch_size: 16
per_device_eval_batch_size: 16
gradient_accumulation_steps: 1
learning_rate: 5e-5
num_train_epochs: 3.0
weight_decay: 0.1

📈 結果

ROUGE	スコア
eval_rouge1	55.0234
eval_rouge2	29.6005
eval_rougeL	44.914
eval_rougeLsum	50.464
predict_rouge1	53.4345
predict_rouge2	28.7445
predict_rougeL	44.1848
predict_rougeLsum	49.1874

メトリック	値
epoch	3.0
eval_gen_len	30.6027
eval_loss	1.4327096939086914
eval_runtime	22.9127
eval_samples	818
eval_samples_per_second	35.701
eval_steps_per_second	0.306
predict_gen_len	30.4835
predict_loss	1.4501988887786865
predict_runtime	26.0269
predict_samples	819
predict_samples_per_second	31.467
predict_steps_per_second	0.269
train_loss	1.2014821151207233
train_runtime	263.3678
train_samples	14732
train_samples_per_second	167.811
train_steps_per_second	1.321
total_steps	348
total_flops	4.26008990669865e+16