オープンソースのwav2vec2-xls-r-300m-Urdu音声認識モデル。ウルドゥー語を高精度に認識し、無料で便利です！

ホーム

Wav2vec2 Xls R 300m Urdu

aasemによって開発

Facebookの3億パラメータの音声認識モデルで、ウルドゥー語に合わせて微調整され、汎用音声8.0ウルドゥー語データセットを基に訓練されています。

音声認識

Transformers

#ウルドゥー語音声認識 #低い単語誤り率 #多言語転移学習

ダウンロード数 16

リリース時間 : 3/2/2022

モデル概要

このモデルはwav2vec2アーキテクチャに基づく自動音声認識(ASR)モデルで、ウルドゥー語に特化して最適化されており、ウルドゥー語の音声をテキストに変換することができます。

モデル特徴

ウルドゥー語最適化

ウルドゥー語に特化して微調整されており、この言語で優れた性能を発揮します。

大規模事前学習

3億パラメータの大規模事前学習モデルを基にしており、強力な音声特徴抽出能力を持っています。

効率的な認識

汎用音声データセットで低い単語誤り率と文字誤り率を達成しています。

モデル能力

ウルドゥー語音声をテキストに変換

音声認識

音声文字起こし

使用事例

音声文字起こし

ウルドゥー語会議記録

ウルドゥー語の会議録音を自動的に文字記録に変換します。

単語誤り率24.59%、文字誤り率6.91%

音声アシスタント

ウルドゥー語ユーザーに音声対話機能を提供します。

教育

言語学習支援

ウルドゥー語学習者の発音評価と文字起こしを支援します。

属性	詳細
モデルタイプ	wav2vec2-xls-r-300m-Urdu
学習データ	Common Voice 8.0ウルドゥー語データセット
評価指標	単語誤り率（WER）、文字誤り率（CER）

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Xls R 300m Urdu

モデル概要

モデル特徴

モデル能力

使用事例

🚀 wav2vec2-xls-r-300m-Urduモデル

✨ 主な機能

📚 ドキュメント

モデル情報

評価結果

📄 ライセンス