N

Nb Wav2vec2 300m Bokmaal

NbAiLabによって開発
VoxRexモデルをベースに微調整されたノルウェー語自動音声認識モデルで、NPSCデータセットで7.03%の単語誤り率を達成しました。
ダウンロード数 86
リリース時間 : 3/2/2022

モデル概要

これは書面ノルウェー語(Bokmål)に最適化された自動音声認識モデルで、3億パラメータのWav2Vec2アーキテクチャに基づき、ノルウェー議会の音声コーパスで微調整されました。

モデル特徴

高性能音声認識
NPSCテストセットで7.03%の単語誤り率(WER)と2.69%の文字誤り率(CER)を達成しました。
言語モデルの統合
5-gram KenLM言語モデルの統合をサポートし、認識精度を大幅に向上させることができます。
効率的なトレーニング
モデルは計算能力の要求が低く、一般的なGPUを使用して1日以内にトレーニングを完了することができます。

モデル能力

ノルウェー語音声をテキストに変換
高精度音声認識
言語モデルによる強化をサポート

使用事例

政府と公共サービス
議会記録の書き起こし
ノルウェー議会の会議録音を自動的に書き起こします。
精度は92.97%に達します。
教育
音声教学の補助
ノルウェー語学習者の発音評価と書き起こしに使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase