N

Nb Wav2vec2 300m Nynorsk

NbAiLabによって開発
VoxRex特徴抽出器をベースに微調整された3億パラメータの音声認識モデルで、ニューノルウェー語(Nynorsk)に最適化されており、NPSCテストセットでのWERは12.22%です。
ダウンロード数 73.53k
リリース時間 : 3/2/2022

モデル概要

このモデルはニューノルウェー語に最適化された自動音声認識(ASR)システムで、Wav2Vec2アーキテクチャを採用し、ノルウェー議会音声コーパス(NPSC)で微調整されています。

モデル特徴

言語モデル強化
5 - gram KenLM言語モデルを統合すると、単語誤り率(WER)が相対的に20.5%低下します。
効率的なトレーニング
最適化されたパラメータ設定により、モデルは一般的なGPUで3 - 4日でトレーニングを完了できます。
多モデルサポート
チームが開発したボクマール語系モデルと組み合わせて、ノルウェー語ASRソリューションマトリックスを形成します。

モデル能力

ニューノルウェー語音声をテキストに変換
長い音声フラグメントの処理(最大30秒)
低リソース言語のサポート

使用事例

政府サービス
議会記録の自動化
ノルウェー議会の会議録音を自動的に文字記録に変換します。
テストセットの文字誤り率はわずか4.19%です。
教育
方言保護
ニューノルウェー語の方言資料のデジタル保存に使用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase