BERT Base NER Ar
B
BERT Base NER Ar
ayoubkirouaneによって開発
アラビア語固有表現認識(NER)タスク向けにファインチューニングされたBERT多言語ベースモデル
ダウンロード数 25
リリース時間 : 9/29/2023
モデル概要
このモデルは多言語BERTベースモデルを基にしており、アラビア語の固有表現認識タスクに特化してファインチューニングされています。テキスト中の人名、地名、組織名などのエンティティを識別できます。
モデル特徴
アラビア語専用NER
アラビア語テキストの固有表現認識に特化して最適化されています
多言語ベース
多言語BERTモデルを基にしており、言語横断能力を備えています
IOB2タグ付け形式
標準的なIOB2タグ付け形式をサポートし、他のシステムとの統合が容易です
モデル能力
アラビア語固有表現認識
多言語NER(限定的サポート)
エンティティ分類(LOC/PER/ORG)
使用事例
情報抽出
アラビア語ニュース分析
アラビア語ニュースから人名、地名、組織名を抽出
ニュース分類やトレンド分析に利用可能
ソーシャルメディア監視
アラビア語ソーシャルメディアコンテンツの主要エンティティを識別
ブランド監視や世論分析に有用
コンテンツ処理
文書要約
主要エンティティを識別することで文書要約の生成を支援
要約の品質と情報密度を向上
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98