W

Wav2vec2hindia

SAGAR4REALによって開発
facebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングした音声認識モデル
ダウンロード数 22
リリース時間 : 3/28/2022

モデル概要

このモデルはインド言語の音声認識タスク向けに最適化されたバージョンで、wav2vec2-xls-r-300mアーキテクチャを基にファインチューニングされています

モデル特徴

XLS-Rアーキテクチャ採用
facebookのwav2vec2-xls-r-300mをベースモデルとして使用し、強力な音声特徴抽出能力を備えています
インド言語向け最適化
特にインド言語向けにファインチューニングされており、関連言語の認識精度向上が期待できます
効率的なトレーニング設定
混合精度トレーニングや勾配蓄積などの技術を採用し、トレーニング効率を最適化しています

モデル能力

音声認識
音声からテキストへの変換
インド言語処理

使用事例

音声文字起こし
インド言語音声のテキスト化
インド言語の音声コンテンツをテキストに変換します
音声アシスタント
インド言語音声インタラクション
インド言語ユーザー向けの音声インタラクション機能を提供します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase