K

Kb Whisper Medium

KBLabによって開発
スウェーデン国立図書館が5万時間以上のスウェーデン語音声で訓練したWhisperモデルで、スウェーデン語音声認識タスクで優れた性能を発揮
ダウンロード数 691
リリース時間 : 2/14/2025

モデル概要

KB-Whisperはスウェーデン語に最適化された自動音声認識(ASR)モデルシリーズで、OpenAIのWhisperアーキテクチャを改良し、スウェーデン語の認識精度を大幅に向上

モデル特徴

最適化されたスウェーデン語認識
スウェーデン語専用に訓練されており、OpenAIオリジナルモデルと比較して平均47%の単語誤り率(WER)を低減
多フォーマット対応
Hugging Face、whisper.cpp(GGML)、onnx、ctranslate2など複数のフォーマットのチェックポイントを提供
多様な文字起こしスタイル
3種類の文字起こしスタイルを選択可能: 簡潔なSubtitle版、デフォルトのStage 2版、詳細なStrict版
大規模訓練データ
5万時間以上のスウェーデン語音声データで訓練され、2つの品質段階に分けられている

モデル能力

スウェーデン語音声認識
タイムスタンプ付き文字起こし
多フォーマット推論サポート
バッチ処理文字起こし

使用事例

音声文字起こし
会議議事録
スウェーデン語会議録音を文字記録に変換
OpenAIオリジナルモデルと比べて精度が大幅に向上
字幕生成
スウェーデン語動画コンテンツの字幕生成
タイムスタンプ付きの正確な文字起こしを提供
音声分析
音声コンテンツ分析
研究やビジネスインテリジェンスのためのスウェーデン語音声コンテンツ分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase