Mbert2mbert Arabic Text Summarization
M
Mbert2mbert Arabic Text Summarization
malmarjehによって開発
これはBERT2BERTアーキテクチャに基づくアラビア語テキスト要約モデルで、mBERTの重みを使用して初期化され、84,764個の段落 - 要約ペアのデータセットで微調整されています。
ダウンロード数 211
リリース時間 : 6/3/2022
モデル概要
このモデルは、アラビア語テキストの抽象的要約、ニュースタイトル生成、および言い換えタスクに特化しています。
モデル特徴
mBERTに基づく初期化
多言語BERT(mBERT)の重みを使用して初期化することで、モデルのアラビア語理解能力が向上します。
大規模な微調整データ
84,764個のアラビア語段落 - 要約ペアのデータセットで微調整されています。
多機能アプリケーション
テキスト要約だけでなく、ニュースタイトル生成やテキスト言い換えにも使用できます。
モデル能力
アラビア語テキスト要約
アラビア語ニュースタイトル生成
アラビア語テキスト言い換え
使用事例
ニュースメディア
ニュース要約生成
ニュース記事の短い要約を自動生成します。
例に示すように、長いニュース段落を簡潔な要約に圧縮できます。
コンテンツ作成
テキストの再記述
アラビア語テキストを言い換えて書き直します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98