N

Nb Wav2vec2 1b Bokmaal

NbAiLabによって開発
Facebook/MetaのXLS - R特徴抽出器をベースに微調整されたノルウェー語自動音声認識モデルで、NPSCテストセットでの単語誤り率は6.33%
ダウンロード数 23.95k
リリース時間 : 3/2/2022

モデル概要

書面ノルウェー語に最適化された自動音声認識モデルで、10億パラメータのXLS - Rアーキテクチャをベースに微調整され、16KHzのオーディオ入力に対応

モデル特徴

高性能認識
NPSCテストセットで6.33%の単語誤り率(言語モデル使用時)を達成
言語モデル統合
5 - gram KenLM言語モデルによる強化をサポートし、認識精度を大幅に向上させる
計算効率最適化
一般的なGPUで3 - 4日で完全なトレーニングが完了し、複数のパラメータ最適化オプションを提供

モデル能力

ノルウェー語音声をテキストに変換
16KHzオーディオ処理
長いオーディオの分割処理(最大30秒)

使用事例

音声文字起こし
議会会議記録
ノルウェー議会会議のオーディオを自動文字起こし
ベースラインモデルと比較して、単語誤り率が17.10%から5.81%に改善
音声アシスタント
ノルウェー語音声指令認識
ノルウェー語のスマートデバイスに音声インタラクションサポートを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase