N

Nb Whisper Large

NbAiLabBetaによって開発
ノルウェー国立図書館が開発した自動音声認識モデルで、Whisperアーキテクチャに基づいており、ノルウェー語と英語の音声文字起こしと翻訳をサポートします。
ダウンロード数 776
リリース時間 : 1/9/2024

モデル概要

NB-Whisper Largeは、OpenAI Whisperをベースに開発された最先端の自動音声認識(ASR)および音声翻訳モデルで、66,000時間のノルウェー語データで学習され、高精度の音声をテキストに変換するタスクに適しています。

モデル特徴

多サイズのモデルシリーズ
Tiny(39M)からLarge(1550M)までの5種類のパラメータ規模のモデルを提供し、さまざまな計算リソースの要件を満たします。
専用バリアントバージョン
逐語的(verbatim)と意味的(semantic)の2種類の専用バリアントを提供し、それぞれ正確な文字起こしと内容要約のシナリオに適しています。
ノルウェー語最適化
66,000時間のノルウェー語データで学習され、ノルウェーの方言やアクセントに特化した最適化が施されています。
多形式対応
PyTorch、TensorFlow、ONNXおよびwhisper.cppのggml形式を提供し、さまざまなデプロイ方法をサポートします。

モデル能力

ノルウェー語音声文字起こし
英語音声文字起こし
音声翻訳
話者分離
タイムスタンプのアライメント

使用事例

メディア処理
放送内容の文字起こし
ノルウェーのテレビ局(NRK)の放送番組を自動的に文字起こしします。
タイムスタンプ付きの字幕ファイルの生成をサポートします。
会議記録
ノルウェー議会の演説内容を自動的に記録します。
意味的バージョンでは簡潔な会議要約を生成できます。
教育研究
言語学研究
ノルウェーの方言の音声特徴を分析します。
逐語的バージョンでは正確な音素レベルの文字起こしを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase