W

Wav2vec2 Large Xlsr Tamil

manandeyによって開発
facebook/wav2vec2-large-xlsr-53を基に、タミル語でCommon Voiceデータセットを使用してファインチューニングされた自動音声認識モデルです。
ダウンロード数 50
リリース時間 : 3/2/2022

モデル概要

これはタミル語向けの自動音声認識(ASR)モデルで、Wav2Vec2アーキテクチャに基づいており、タミル語の音声をテキストに変換するのに適しています。

モデル特徴

タミル語専用
タミル語に特化して最適化された音声認識モデル
XLSR事前学習ベース
大規模なクロスランゲージ音声表現(XLSR)を使用した事前学習により、優れた音声特徴抽出能力を備えています
Common Voiceファインチューニング
Common Voiceのタミル語データセットを使用してファインチューニングされており、実際の音声シナリオに適応しています

モデル能力

タミル語音声認識
16kHz音声処理
エンドツーエンド音声テキスト変換

使用事例

音声書き起こし
タミル語音声転写
タミル語の音声内容をテキストに変換
テストWERは56.44%
音声アシスタント
タミル語音声コマンド認識
タミル語音声アシスタントや制御システムの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase