K

Kb Whisper Small

KBLabによって開発
スウェーデン国立図書館が公開したWhisperモデルで、スウェーデン語に最適化されており、50,000時間以上のスウェーデン語音声データでトレーニングされ、OpenAIのオリジナル版を上回る性能
ダウンロード数 28.61k
リリース時間 : 2/14/2025

モデル概要

OpenAI Whisperアーキテクチャを基に最適化されたスウェーデン語自動音声認識(ASR)モデルで、単語誤り率(WER)を大幅に低減し、複数の推論フォーマットをサポート

モデル特徴

スウェーデン語最適化
スウェーデン語に特化して最適化トレーニングを行い、単語誤り率をOpenAIオリジナル版より47%低減
多フォーマット対応
Hugging Face、GGML、ONNX、ctranslate2など複数の推論フォーマットを提供
2段階トレーニング
2段階のトレーニング戦略を採用し、第1段階で低い閾値フィルタリング、第2段階で厳格な品質フィルタリングを実施
転記スタイル選択可能
3つの転記スタイルを提供:簡潔な字幕版、バランスの取れた標準版、詳細な厳密版

モデル能力

スウェーデン語音声認識
タイムスタンプ付き転記
音声内容分析
多フォーマット推論サポート

使用事例

音声転記
会議議事録
スウェーデン語の会議録音を自動的に文字記録に転記
単語誤り率が6.4%まで低減(CommonVoiceデータセット)
メディア字幕生成
スウェーデン語の動画コンテンツに自動的に字幕を生成
字幕専用最適化バージョンをサポート(revision=subtitle)
音声分析
音声内容分析
スウェーデン語の音声内容を分析し、キー情報を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase