W

Wav2vec2 Large Xlsr 53 Tamil

Rajaram1996によって開発
これはfacebook/wav2vec2-large-xlsr-53モデルをタミル語で微調整した自動音声認識モデルで、公共音声ライブラリのデータセットを使用して訓練されています。
ダウンロード数 78
リリース時間 : 3/2/2022

モデル概要

このモデルはタミル語の自動音声認識タスクに使用され、タミル語の音声をテキストに変換することができます。

モデル特徴

タミル語音声認識
タミル語に特化して最適化された音声認識モデル
XLSR - 53アーキテクチャに基づく
強力なwav2vec2-large-xlsr-53アーキテクチャを使用して微調整されています
公共音声ライブラリ訓練
Common Voiceデータセットを使用して訓練され、良好な汎化能力を持っています

モデル能力

タミル語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
タミル語音声文字起こし
タミル語の音声内容をテキストに変換する
Common Voiceタミル語テストセットでのWERは69.76%です
音声アシスタント
タミル語音声アシスタント
タミル語をサポートする音声アシスタントアプリの開発に使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase