NER Darija MAR FSBM
N
NER Darija MAR FSBM
mohannad-taziによって開発
BERTアーキテクチャに基づく固有表現認識モデルで、モロッコアラビア語(Darija)テキスト内の人名、場所、組織などのエンティティを識別するために特別に設計されています。
ダウンロード数 15
リリース時間 : 12/26/2024
モデル概要
このモデルはDarNERcorpデータセットでファインチューニングされた固有表現認識(NER)モデルで、ソーシャルメディアやニュース記事からモロッコ方言テキストの主要なエンティティ情報を抽出するのに適しています。
モデル特徴
モロッコ方言専用
モロッコアラビア語(Darija)に特化して最適化されており、方言中の固有表現を効果的に識別できます。
多カテゴリエンティティ認識
人名(PER)、場所(LOC)、組織(ORG)およびその他のエンティティ(MISC)など、さまざまなエンティティタイプを識別できます。
BERTアーキテクチャベース
aubmindlab/bert-base-arabertv02事前学習モデルを採用しており、強力な言語理解能力を備えています。
モデル能力
モロッコ方言テキスト中の固有表現を識別
エンティティタイプの分類(人名、場所、組織など)
ソーシャルメディアやニューステキストの処理
使用事例
ソーシャルメディア分析
モロッコ方言投稿エンティティ抽出
モロッコ方言のソーシャルメディア投稿やツイートから主要なエンティティ情報を抽出
非公式テキスト中の固有表現を識別可能
ニュース処理
ニュース記事の主要エンティティ識別
ニュース記事中の主要人物、場所、組織を識別
ニュース内容の迅速な理解を支援
情報抽出
公式/非公式テキストエンティティ抽出
様々な形式のモロッコ方言テキストから固有表現を抽出
多様なテキスト形式の情報抽出をサポート
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98