W

Wav2vec2 Base Common Voice 40p Persian Colab

zohaによって開発
このモデルはfacebook/wav2vec2-baseをペルシャ語データセットでファインチューニングした音声認識モデルで、主にペルシャ語音声からテキストへの変換タスクに使用されます。
ダウンロード数 120
リリース時間 : 6/26/2022

モデル概要

これはペルシャ語に最適化された自動音声認識(ASR)モデルで、wav2vec2アーキテクチャに基づき、Common Voiceペルシャ語データセットで40エポックのファインチューニングを行いました。

モデル特徴

ペルシャ語最適化
ペルシャ語の音声特性に特化して最適化されたトレーニング
wav2vec2ベース
Facebookがオープンソース化したwav2vec2-baseアーキテクチャをベースモデルとして採用
中規模トレーニング
40エポックのトレーニングを経て、検証セットで0.6024の単語誤り率を達成

モデル能力

ペルシャ語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
ペルシャ語音声文字起こし
ペルシャ語の音声コンテンツをテキストに変換
単語誤り率0.6024
音声アシスタント
ペルシャ語音声コマンド認識
ペルシャ語音声アシスタントのコマンド認識システムに使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase