Bert2bert Cnn Daily Mail
B
Bert2bert Cnn Daily Mail
patrickvonplatenによって開発
BERT2BERTアーキテクチャに基づく要約生成モデルで、CNN/DailyMailデータセットに特化してファインチューニングされており、ニュース記事の要約タスクに適しています。
ダウンロード数 1,072
リリース時間 : 3/2/2022
モデル概要
このモデルはBERT2BERTアーキテクチャに基づくエンコーダ-デコーダモデルで、CNN/DailyMailニュース要約データセットに特化してファインチューニングされており、高品質なニュース記事の要約を生成できます。
モデル特徴
高品質な要約生成
CNN/DailyMailテストセットでROUGE-2スコア18.6853を達成し、一貫性があり正確なニュース要約を生成できます。
ウォームスタートBERTベース
事前学習済みBERTモデルをベースとして利用し、ウォームスタート方式でトレーニング効率とモデル性能を向上させています。
エンコーダ-デコーダアーキテクチャ
Transformerアーキテクチャのエンコーダ-デコーダ構造を採用しており、シーケンス間のテキスト生成タスクに適しています。
モデル能力
ニュース記事要約生成
長文圧縮
キー情報抽出
使用事例
ニュースメディア
ニュース記事自動要約
長文ニュース記事に対して簡潔で正確な要約を生成
CNN/DailyMailテストセットでROUGE-Lスコア28.191を達成
コンテンツアグリゲーション
複数ソースニュース要約
異なるソースからのニュースコンテンツに対して統一的な要約を生成
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98