W

Wav2vec2 Large Xlsr Tamil Commonvoice

nikhil6041によって開発
このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceタミル語データセットでファインチューニングした音声認識モデルです
ダウンロード数 43
リリース時間 : 3/2/2022

モデル概要

タミル語に最適化された音声認識モデルで、wav2vec2アーキテクチャに基づき、Common Voiceデータセットでファインチューニングされています

モデル特徴

タミル語最適化
タミル語音声認識タスクに特化してファインチューニングされています
XLSRアーキテクチャベース
クロスリンガル音声表現学習(XLSR)アーキテクチャを使用し、強力な音声特徴抽出能力を備えています
Common Voiceデータセットでトレーニング
公開されているCommon Voiceタミル語データセットでトレーニングされています

モデル能力

タミル語音声認識
音声からテキストへの変換
音声コンテンツの文字起こし

使用事例

音声文字起こし
タミル語音声文字起こし
タミル語音声をテキストに変換します
単語誤り率(WER) 0.8512
音声アシスタント
タミル語音声コマンド認識
タミル語音声アシスタントの構築に使用できます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase