K

Kb Whisper Tiny

KBLabによって開発
スウェーデン国立図書館が公開したWhisperモデルで、スウェーデン語音声認識に特化して最適化されており、OpenAIのオリジナル版と比べて誤り率が大幅に低下しています。
ダウンロード数 1,791
リリース時間 : 2/14/2025

モデル概要

Whisperアーキテクチャを最適化したスウェーデン語音声認識モデルで、50,000時間以上のスウェーデン語データで訓練され、さまざまな推論形式と文字起こしスタイルを提供します。

モデル特徴

高性能スウェーデン語認識
OpenAIのwhisper - large - v3と比べて、平均で47%の単語誤り率(WER)が低下します。
多形式サポート
Hugging Face/whisper.cpp/ONNX/ctranslate2などのさまざまな推論形式を提供します。
多スタイル文字起こし
subtitle(簡潔)/standard(デフォルト)/strict(詳細)の3種類の文字起こしスタイルを提供します。
大規模訓練データ
56,514時間のスウェーデン語データで事前学習 + 8,533時間で微調整を行いました。

モデル能力

スウェーデン語音声をテキストに変換
タイムスタンプ付きの音声認識
多スタイルのテキスト文字起こし

使用事例

音声文字起こし
スウェーデン語会議記録
スウェーデン語の会議録音をタイムスタンプ付きのテキスト記録に変換します。
WERが11.2%まで低下(NSTデータセット)
メディア字幕生成
スウェーデン語のビデオコンテンツに自動で字幕を生成します。
subtitleスタイルの最適化出力を提供します。
音声分析
音声データアノテーション
スウェーデン語音声データセットのアノテーションを支援します。
BLEUスコアが最大89.8(FLEURSデータセット)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase