W

Wav2vec2 Base 10k Voxpopuli Ft Sl

facebookによって開発
Facebook Wav2Vec2基本モデルに基づき、VoxPopuliコーパスの10K未ラベルサブセットで事前学習され、スロベニア語転写データでファインチューニングされた自動音声認識モデルです。
ダウンロード数 26
リリース時間 : 3/2/2022

モデル概要

このモデルはスロベニア語に最適化された自動音声認識システムで、音声をテキストに変換できます。

モデル特徴

多言語事前学習
VoxPopuli多言語コーパスで事前学習されており、言語横断学習能力を有します
スロベニア語最適化
スロベニア語専用にファインチューニングされており、この言語の認識精度が向上しています
エンドツーエンドモデル
従来の音声認識プロセスにおける手動特徴抽出を必要とせず、生の音声から直接音声表現を学習します

モデル能力

音声認識
音声テキスト変換
スロベニア語処理

使用事例

音声転写
会議議録自動化
スロベニア語会議録音を自動的に文字記録に変換
音声アシスタント開発
スロベニア語音声アシスタントに音声認識機能を提供
アクセシビリティ技術
リアルタイム字幕生成
スロベニア語動画コンテンツにリアルタイム字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase