W

Wav2vec2 Xlsr 300m Finnish

aapotによって開発
facebook/wav2vec2-xls-r-300mをベースに、フィンランド語自動音声認識タスク向けにファインチューニングした音響モデル。275.6時間のフィンランド語注釈付き音声データで学習
ダウンロード数 96
リリース時間 : 3/2/2022

モデル概要

このモデルはフィンランド語音声テキスト変換タスクに適しており、Wav2Vec2 XLS-R事前学習モデルのファインチューン版で、フィンランド語自動音声認識をサポートします。

モデル特徴

多言語事前学習基盤
128言語をサポートするWav2Vec2 XLS-R事前学習モデルをベースにファインチューニングされており、強力な音声表現能力を有する
効率的なファインチューニング
275.6時間のフィンランド語注釈データを使用して対象的にファインチューニングされ、フィンランド語認識効果を最適化
言語モデル拡張サポート
KenLM言語モデルと組み合わせることで、さらに転写精度を向上可能

モデル能力

フィンランド語音声認識
短音声転写(最長20秒)
音声テキスト変換

使用事例

音声転写
議会議事録
フィンランド議会会議の音声内容を転写
議会データセットで良好なパフォーマンス
日常会話転記
フィンランド語の日常会話をテキストに変換
標準発音には効果的だが、方言認識は限定的
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase