W

Wav2vec2 Base 10k Voxpopuli Ft Hr

facebookによって開発
Facebook Wav2Vec2アーキテクチャに基づく音声認識モデルで、VoxPopuliコーパスで事前学習されクロアチア語データでファインチューニングされています
ダウンロード数 20
リリース時間 : 3/2/2022

モデル概要

これは自動音声認識(ASR)モデルで、クロアチア語に特化して最適化されており、音声をテキストに変換できます

モデル特徴

多段階学習
大規模な未ラベルデータで事前学習後、クロアチア語のラベル付きデータでファインチューニング
効率的な表現学習
Wav2Vec2アーキテクチャを使用して生の音声から直接効果的な音声表現を学習
言語特化最適化
クロアチア語に特化して最適化され、この言語の認識精度を向上

モデル能力

クロアチア語音声認識
音声からテキストへの変換
音声文字起こし

使用事例

音声文字起こし
クロアチア語音声書き起こし
クロアチア語の音声内容をテキスト形式に変換
音声アシスタント
クロアチア語音声コマンド認識
クロアチア語をサポートする音声アシスタントやスマートデバイスに使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase