Hubert Large Arabic Egyptian
このモデルはアラビア語Hubert-Largeをベースにファインチューニングしたバージョンで、MGB-3とエジプトアラビア語会話音声コーパスデータセットで学習され、エジプトアラビア語で25.9%の単語誤り率という現在最高の性能を達成しました。
ダウンロード数 369
リリース時間 : 7/12/2022
モデル概要
エジプトアラビア語に最適化された自動音声認識モデルで、Hubert-Largeアーキテクチャを基に、MGB-3とエジプトアラビア語会話音声コーパスでファインチューニングされています。
モデル特徴
エジプトアラビア語最適化
エジプトアラビア語方言に特化して最適化されており、エジプト方言データセットで優れた性能を発揮します
低単語誤り率
テストセットで25.9%、検証セットで23.5%の単語誤り率を達成
言語モデル不要
モデルが直接認識結果を出力するため、追加の言語モデルは不要です
モデル能力
エジプトアラビア語音声認識
連続音声テキスト変換
方言音声処理
使用事例
音声文字起こし
エジプトアラビア語会話文字起こし
日常会話音声をテキストに変換
単語誤り率25.9%
カスタマーサービス通話記録
コールセンターのエジプトアラビア語通話を自動文字起こし
音声アシスタント
エジプト方言音声コマンド認識
音声アシスタントにエジプト方言サポートを提供
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98