N

Nb Whisper Large Verbatim

NbAiLabBetaによって開発
OpenAI Whisperを基に開発されたノルウェー語自動音声認識モデルで、追加トレーニングによりすべて小文字で句読点のない逐語転写を実現
ダウンロード数 765
リリース時間 : 1/11/2024

モデル概要

ノルウェー語に最適化された音声認識モデルで、元の音声内容を忠実に記録し、正確な転写が必要なシナリオに適しています

モデル特徴

正確な逐語転写
すべて小文字で句読点のないテキストを出力し、元の音声内容を厳密に保持。言語学分析などのシナリオに最適
多言語サポート
ノルウェー語(ブークモールとニーノシュク)および英語の音声認識に対応
大規模トレーニング
6.6万時間のノルウェー語音声データでトレーニング。議会演説、テレビ字幕など多様なコーパスを含む
複数サイズ選択
39Mから1550Mパラメータまでの5種類のモデルサイズを提供し、異なるハードウェア要件に対応

モデル能力

ノルウェー語音声認識
英語音声認識
長音声処理(チャンク分割対応)
タイムスタンプ付き転写
話者分離(WhisperXとの併用が必要)

使用事例

学術研究
言語学分析
元の音声の正確な文字記録を取得し、音声特徴の研究に利用
非標準的な発音を含むすべての音声詳細を保持
メディア処理
字幕生成
ノルウェー語動画コンテンツのオリジナル字幕を生成
28秒チャンク処理で長い動画に対応
会議記録
複数話者転写
WhisperXと併用して話者分離された会議記録を実現
異なる発言者の話し内容を自動的に注釈
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase