W

Wav2vec2 Xlsr 1B NPSC NN

NbAiLabによって開発
facebook/wav2vec2-xls-r-1bを基に新ノルウェー語(NN)音声データセットでファインチューニングした自動音声認識モデル
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

これは新ノルウェー語に最適化された音声認識モデルで、NPSCデータセットでファインチューニングされており、低い単語誤り率と文字誤り率を実現しています。

モデル特徴

低誤り率
新ノルウェー語テストセットで13.35%の単語誤り率と4.54%の文字誤り率を達成
大規模モデル基盤
facebookのwav2vec2-xls-r-1b大規模モデルをファインチューニングしており、強力な音声特徴抽出能力を備えています
専門データセットでの訓練
NbAiLab/NPSC専門音声データセットを使用して訓練されており、新ノルウェー語に最適化されています

モデル能力

新ノルウェー語音声認識
16KHz音声処理
高精度文字起こし

使用事例

音声文字起こし
会議議事録
新ノルウェー語会議録音を文字記録に変換
高精度な文字起こし結果
メディア字幕生成
新ノルウェー語動画コンテンツの自動字幕生成
手作業による字幕制作の負担軽減
音声分析
音声データ分析
新ノルウェー語音声データの言語的特徴を分析
言語学研究や音声分析をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase