X

Xls R Ta

jejomiによって開発
facebook/wav2vec2-xls-r-300mをタミル語データセットでファインチューニングした自動音声認識モデル
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

このモデルはタミル語に最適化された自動音声認識(ASR)モデルで、wav2vec2-xls-r-300mアーキテクチャをCommon Voiceタミル語データセットでファインチューニングしたものです

モデル特徴

タミル語最適化
タミル語音声認識タスクに特化してファインチューニングされています
大規模事前学習モデルベース
wav2vec2-xls-r-300m事前学習モデルを基にしており、強力な音声特徴抽出能力を有します
オープンソースライセンス
Apache-2.0ライセンスを採用しており、商用・研究用途での利用が可能です

モデル能力

タミル語音声からテキストへの変換
音声認識
音声文字起こし

使用事例

音声アプリケーション
タミル語音声アシスタント
タミル語音声アシスタントや対話システムの開発に使用できます
音声文字起こしサービス
タミル語音声コンテンツをテキストに変換します
教育
言語学習アプリ
学習者がタミル語の発音とリスニングを練習するのを支援します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase