W

Wav2vec2 Xls R 300m Npsc Bokmaal

NbAiLabによって開発
これはXLS-Rアーキテクチャに基づく自動音声認識モデルで、ノルウェー語の書き言葉(ブークモール)に特化して訓練されており、NPSCデータセットで優れた性能を発揮します。
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

このモデルはFacebookのwav2vec2-xls-r-300mアーキテクチャで訓練された自動音声認識システムで、ノルウェー語の書き言葉(ブークモール)の音声からテキストへの変換タスクに特化しています。

モデル特徴

ノルウェー語最適化
ノルウェー語の書き言葉(ブークモール)に特化して訓練・最適化されています
高性能
NPSCテストセットで7.56%の単語誤り率と2.82%の文字誤り率を達成
大規模トレーニング
NPSCデータセットを使用して訓練されており、豊富なノルウェー語音声データを含んでいます

モデル能力

ノルウェー語音声認識
音声からテキストへの変換
音声コンテンツの文字起こし

使用事例

音声文字起こし
会議議事録
ノルウェー語の会議録音を自動的にテキストに変換
高精度な文字起こし結果
メディア字幕生成
ノルウェー語の動画コンテンツに自動的に字幕を生成
メディアコンテンツのアクセシビリティ向上
音声アシスタント
ノルウェー語音声コマンド認識
ノルウェー語音声アシスタントシステムでの音声コマンド理解に使用
音声インタラクションの精度向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase