wav2vec2-large-xls-r-300m-slowenian-with-lmオープンソースモデル - 無料でデプロイ可能、スロベニア語の音声を正確に認識

Wav2vec2 Large Xls R 300m Slowenian With Lm

mfleckによって開発

facebook/wav2vec2-xls-r-300mをファインチューニングしたスロベニア語音声認識モデルで、言語モデルサポートを備えています

ダウンロード数 16

リリース時間 : 3/15/2022

モデル概要

このモデルはスロベニア語に最適化された自動音声認識(ASR)システムで、オリジナルのwav2vec2-xls-r-300mモデルをベースにファインチューニングされ、認識精度を向上させるために言語モデルが統合されています

言語モデル強化

言語モデルを統合することで、音声認識の精度と流暢さを大幅に向上させています

効率的なファインチューニング

大規模な事前学習モデルwav2vec2-xls-r-300mをベースにファインチューニングしており、事前学習の知識を十分に活用しています

多段階トレーニング

段階的なトレーニング戦略を採用し、高損失から低損失へと徐々に最適化しています

スロベニア語音声からテキストへの変換

連続音声認識

言語モデルを備えた音声認識

音声文字起こし

会議議録の自動化

スロベニア語の会議録音を自動的に文字記録に変換します

単語誤り率34.8%

音声アシスタント

スロベニア語ユーザー向けに音声インタラクションをサポートします

学習損失	エポック	ステップ	検証損失	単語誤り率 (Wer)
7.9937	2.5	100	3.1565	1.0
3.0466	5.0	200	3.0009	0.9992
2.9708	7.5	300	2.9494	0.9992
2.0519	10.0	400	0.8874	0.7290
0.5773	12.5	500	0.5258	0.5037
0.3427	15.0	600	0.4767	0.4649
0.2612	17.5	700	0.4549	0.4209
0.212	20.0	800	0.4294	0.3860
0.1748	22.5	900	0.4085	0.3769
0.1587	25.0	1000	0.4017	0.3673
0.1435	27.5	1100	0.3927	0.3538
0.1314	30.0	1200	0.3935	0.3480