W

Wav2vec2 Base Common Voice Fa Demo Colab

zohaによって開発
このモデルはfacebook/wav2vec2-baseをファインチューニングしたペルシャ語音声認識モデルで、ペルシャ語音声からテキストへの変換タスクに適しています。
ダウンロード数 15
リリース時間 : 4/18/2022

モデル概要

これはペルシャ語に最適化された音声認識モデルで、wav2vec2アーキテクチャに基づき、Common Voiceのペルシャ語データセットでファインチューニングされています。

モデル特徴

ペルシャ語最適化
ペルシャ語の音声特性に特化してファインチューニングされています
wav2vec2アーキテクチャベース
Facebookのwav2vec2-baseをベースモデルとして採用
低い単語誤り率
評価データセットで1.0の単語誤り率を達成

モデル能力

ペルシャ語音声認識
音声からテキストへの変換

使用事例

音声書き起こし
ペルシャ語音声転写
ペルシャ語の音声内容をテキストに変換
単語誤り率1.0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase