T

T5 Darija Summarization

Developed by Kamel
自動テキスト要約タスクに使用する、19,806編のモロッコアラビア語方言ニュース記事とそのタイトルを含むデータセット
Downloads 170
Release Time : 3/2/2022

Model Overview

このデータセットは、2018年から2020年の間にGoud.maウェブサイトから収集されたモロッコアラビア語方言ニュース記事を含み、主にモロッコアラビア語方言の自動テキスト要約研究に使用されます。

Model Features

大規模モロッコ方言データセット
19,806編のニュース記事を含み、現在最大のモロッコアラビア語方言要約データセットの1つです。
バイリンガル混合コンテンツ
本文にはモロッコアラビア方言(ダリジャ)と現代標準アラビア語(MSA)の混合コンテンツが含まれ、タイトルはすべてダリジャです。
明確な時間範囲
すべての記事は2018年1月1日から2020年12月31日の間に収集されており、データの時効性が高いです。

Model Capabilities

モロッコアラビア語方言テキスト要約
混合言語テキスト処理
ニュースコンテンツ分析

Use Cases

自然言語処理
モロッコ方言要約モデルのトレーニング
このデータセットを使用して、モロッコアラビア語方言に対する自動要約モデルをトレーニングします。
方言言語学研究
モロッコアラビア語方言の文法構造と語彙の使用特徴を分析します。
ニュース分析
モロッコニューストレンド分析
データセット内のニュースコンテンツに基づいて、2018年から2020年のモロッコ社会のホットトピックを分析します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase