W

Wav2vec2 Large Hindicone

SAGAR4REALによって開発
このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングした音声認識モデルで、ヒンディー語をサポートしています。
ダウンロード数 16
リリース時間 : 3/27/2022

モデル概要

wav2vec2-large-hindiconeはwav2vec2アーキテクチャに基づく音声認識モデルで、ヒンディー語に特化して最適化されています。

モデル特徴

wav2vec2-xls-r-300mベースのファインチューニング
強力なwav2vec2-xls-r-300mベースモデルでファインチューニングされ、優れた音声特徴抽出能力を継承しています
ヒンディー語最適化
ヒンディー語音声認識タスクに特化して最適化されています
効率的なトレーニング
混合精度トレーニングや勾配蓄積などの技術を使用してトレーニング効率を向上させています

モデル能力

ヒンディー語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
ヒンディー語音声文字起こし
ヒンディー語の音声コンテンツをテキストに変換します
音声アシスタント
ヒンディー語音声アシスタント
ヒンディー語ユーザー向けに音声インタラクション機能を提供します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase