W

Wav2vec2 Large Xlsr Persian V3

masoumehbによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルをcommon_voiceデータセットでファインチューニングしたペルシャ語音声認識モデルです。
ダウンロード数 21
リリース時間 : 5/24/2022

モデル概要

このモデルは主にペルシャ語の自動音声認識(ASR)タスクに使用され、wav2vec2アーキテクチャに基づいて最適化されています。

モデル特徴

ペルシャ語最適化
ペルシャ語音声認識タスクに特化してファインチューニングされています
wav2vec2アーキテクチャベース
facebookのwav2vec2-large-xlsr-53をベースモデルとして採用
Common Voiceデータセットでトレーニング
Common Voiceデータセットを使用してファインチューニング

モデル能力

ペルシャ語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
ペルシャ語音声文字起こし
ペルシャ語音声をテキストに変換
音声アシスタント
ペルシャ語音声コマンド認識
ペルシャ語音声アシスタントの基本的な認識能力に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase