W

Wav2vec2 Large Xls R 300m Slowenian With Lm

mfleckによって開発
facebook/wav2vec2-xls-r-300mをファインチューニングしたスロベニア語音声認識モデルで、言語モデルサポートを備えています
ダウンロード数 16
リリース時間 : 3/15/2022

モデル概要

このモデルはスロベニア語に最適化された自動音声認識(ASR)システムで、オリジナルのwav2vec2-xls-r-300mモデルをベースにファインチューニングされ、認識精度を向上させるために言語モデルが統合されています

モデル特徴

言語モデル強化
言語モデルを統合することで、音声認識の精度と流暢さを大幅に向上させています
効率的なファインチューニング
大規模な事前学習モデルwav2vec2-xls-r-300mをベースにファインチューニングしており、事前学習の知識を十分に活用しています
多段階トレーニング
段階的なトレーニング戦略を採用し、高損失から低損失へと徐々に最適化しています

モデル能力

スロベニア語音声からテキストへの変換
連続音声認識
言語モデルを備えた音声認識

使用事例

音声文字起こし
会議議録の自動化
スロベニア語の会議録音を自動的に文字記録に変換します
単語誤り率34.8%
音声アシスタント
スロベニア語ユーザー向けに音声インタラクションをサポートします
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase