W

Wav2vec2 Large Xls R 300m Ta Colab

Subhashini17によって開発
wav2vec2-large-xls-r-300mアーキテクチャに基づくタミル語音声認識モデル、汎用音声データセットでファインチューニング済み
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

このモデルはwav2vec2-large-xls-r-300mアーキテクチャに基づく音声認識モデルで、特にタミル語向けに最適化・ファインチューニングされています。

モデル特徴

大規模事前学習
3億パラメータのwav2vec2-large-xls-r-300mアーキテクチャに基づき、強力な音声特徴抽出能力を有する
タミル語最適化
タミル語向けに特別にファインチューニングされており、この言語の認識精度が向上している
効率的な訓練
混合精度訓練や勾配蓄積などの技術を使用して訓練効率を最適化

モデル能力

タミル語音声認識
音声からテキストへの変換
音声コンテンツ分析

使用事例

音声文字起こし
タミル語会議議事録
タミル語の会議録音を自動的に文字起こし
タミル語メディア字幕生成
タミル語動画コンテンツに自動的に字幕を生成
音声アシスタント
タミル語音声コマンド認識
タミル語音声アシスタントアプリケーション向けのコマンド認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase