V

Vakyansh Wav2vec2 Tamil Tam 250

Harveenchadhaによって開発
Wav2Vec2アーキテクチャに基づくタミル語自動音声認識モデルで、Harveen Chadhaによって開発され、4200時間のヒンディー語データで微調整されました。
ダウンロード数 1,843
リリース時間 : 3/2/2022

モデル概要

このモデルは、FacebookのWav2Vec2アーキテクチャに基づき、多言語事前学習モデルCLSRIL - 23を微調整して、タミル語用に設計された自動音声認識(ASR)システムです。

モデル特徴

多言語事前学習基礎
CLSRIL - 23多言語モデルを基に微調整され、言語間の転移学習能力を持っています。
大規模訓練データ
4200時間のアノテーション付き音声データを使用して訓練されました。
言語モデル依存なし
外部の言語モデルを組み合わせる必要なく、直接認識結果を出力します。
オープンソース利用可能
完全な訓練コードとモデルの重みがオープンソース化されています。

モデル能力

タミル語音声認識
16kHzオーディオ処理
エンドツーエンドの音声からテキストへの変換

使用事例

音声文字起こし
タミル語音声の文字起こし
タミル語の音声内容をテキストに変換します。
単語誤り率53.64%(Common Voiceテストセット)
音声アシスタント
タミル語音声指令認識
タミル語音声アシスタントに基本的な認識能力を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase