hubert-large-arabic-egyptianオープンソースモデル - エジプトアラビア語の音声認識を最適化し、単語誤り率を低減する

Hubert Large Arabic Egyptian

omarxadelによって開発

このモデルはアラビア語Hubert-Largeをベースにファインチューニングしたバージョンで、MGB-3とエジプトアラビア語会話音声コーパスデータセットで学習され、エジプトアラビア語で25.9%の単語誤り率という現在最高の性能を達成しました。

音声認識

Transformers

アラビア語#エジプトアラビア語認識 #低単語誤り率 #言語モデル不要

ダウンロード数 369

リリース時間 : 7/12/2022

モデル概要

エジプトアラビア語に最適化された自動音声認識モデルで、Hubert-Largeアーキテクチャを基に、MGB-3とエジプトアラビア語会話音声コーパスでファインチューニングされています。

モデル特徴

エジプトアラビア語最適化

エジプトアラビア語方言に特化して最適化されており、エジプト方言データセットで優れた性能を発揮します

低単語誤り率

テストセットで25.9%、検証セットで23.5%の単語誤り率を達成

言語モデル不要

モデルが直接認識結果を出力するため、追加の言語モデルは不要です

モデル能力

エジプトアラビア語音声認識

連続音声テキスト変換

方言音声処理

使用事例

音声文字起こし

エジプトアラビア語会話文字起こし

日常会話音声をテキストに変換

単語誤り率25.9%

カスタマーサービス通話記録

コールセンターのエジプトアラビア語通話を自動文字起こし

音声アシスタント

エジプト方言音声コマンド認識

音声アシスタントにエジプト方言サポートを提供

検証用WER	テスト用WER
23.55	25.59

プロパティ	詳細
モデルタイプ	Automatic Speech Recognition
タグ	CTC、Attention、pytorch、Transformer
訓練データ	MGB-3、egyptian-arabic-conversational-speech-corpus
評価指標	WER

タスク	評価指標	値
Automatic Speech Recognition	テスト用WER	25.9
Automatic Speech Recognition	検証用WER	23.5

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Hubert Large Arabic Egyptian

モデル概要

モデル特徴

モデル能力

使用事例

🚀 アラビア語版Hubert-Large - CTCを用いてMGB-3とエジプトアラビア語会話音声コーパスでファインチューニング済み (言語モデルなし)

📄 ライセンス

📚 ドキュメント

モデル情報

モデルの結果

🎉 謝辞