W

Wav2vec2 Large Xlsr 53 Tamil

Amrrsによって開発
これはfacebook/wav2vec2-large-xlsr-53をベースに、タミル語のCommon Voiceデータセットで微調整された自動音声認識モデルです。
ダウンロード数 32.87k
リリース時間 : 3/2/2022

モデル概要

このモデルはタミル語の自動音声認識タスクに使用され、タミル語の音声をテキストに変換することができます。

モデル特徴

タミル語対応
タミル語に特化して最適化された音声認識モデル
XLSR - 53をベースに微調整
facebook/wav2vec2-large-xlsr-53をベースに、タミル語に合わせて微調整されています。
16kHzサンプリングレート対応
モデルは16kHzサンプリングレートの音声入力に対応しています。

モデル能力

タミル語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
タミル語音声文字起こし
タミル語の音声内容をテキストに変換する
Common Voiceタミル語テストセットでのWERは82.94%です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase