N

Nb Whisper Large Distil Turbo Beta

NbAiLabによって開発
ノルウェー国立図書館が開発したノルウェー語自動音声認識モデルの軽量化高速バージョン。蒸留プロセスによりパラメータ数を削減しながら、文字起こし品質を維持。
ダウンロード数 478
リリース時間 : 11/28/2024

モデル概要

これはノルウェー語(ブークモール)に最適化された自動音声認識モデルで、リソースが限られた環境でのリアルタイム文字起こしに特に適しています。

モデル特徴

効率的な推論
パラメータ数を1550Mから756Mに削減し、推論速度を大幅に向上
リソース最適化
低メモリデバイスやエッジコンピューティングシナリオ向けに設計
精度維持
蒸留技術によりオリジナルの大規模モデルと同等の認識精度を保持
多フォーマット対応
PyTorch、TensorFlow、whisper.cpp、ONXXなど複数のフォーマットを提供

モデル能力

ノルウェー語音声テキスト変換
リアルタイム音声認識
低遅延文字起こし
エッジデバイス展開

使用事例

リアルタイム文字起こし
モバイル端末音声入力
スマートフォンなどのモバイルデバイスでリアルタイム音声テキスト変換を実現
会議議事録
会議の音声内容を自動的に文字起こし
メディア処理
放送コンテンツ字幕生成
ノルウェー放送協会(NRK)番組の字幕を自動生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase