W

Wav2vec2 Large Xlsr 53 Finnish

vasilisによって開発
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたフィンランド語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポート
ダウンロード数 27
リリース時間 : 3/2/2022

モデル概要

このモデルはWav2Vec2アーキテクチャに基づくフィンランド語自動音声認識(ASR)モデルで、Common VoiceとCSS10のフィンランド語データセットを使用してファインチューニングされており、音声からテキストへの変換タスクに直接使用可能

モデル特徴

複数データセットのファインチューニング
Common VoiceとCSS10フィンランド語データセットを同時に使用してトレーニングし、モデルの適応性を向上
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
16kHzサンプリングレートサポート
16kHzサンプリングレートの音声入力に特化して最適化

モデル能力

フィンランド語音声認識
音声からテキストへの変換
自動音声転写

使用事例

音声転写
フィンランド語音声からテキストへ
フィンランド語の音声コンテンツをテキスト形式に変換
テストWER 38.34%、CER 6.55%
音声アシスタント
フィンランド語音声コマンド認識
フィンランド語音声アシスタントやスマートホームシステムの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase