K

Kb Whisper Medium

Developed by KBLab
スウェーデン国立図書館が5万時間以上のスウェーデン語音声で訓練したWhisperモデルで、スウェーデン語音声認識タスクで優れた性能を発揮
Downloads 691
Release Time : 2/14/2025

Model Overview

KB-Whisperはスウェーデン語に最適化された自動音声認識(ASR)モデルシリーズで、OpenAIのWhisperアーキテクチャを改良し、スウェーデン語の認識精度を大幅に向上

Model Features

最適化されたスウェーデン語認識
スウェーデン語専用に訓練されており、OpenAIオリジナルモデルと比較して平均47%の単語誤り率(WER)を低減
多フォーマット対応
Hugging Face、whisper.cpp(GGML)、onnx、ctranslate2など複数のフォーマットのチェックポイントを提供
多様な文字起こしスタイル
3種類の文字起こしスタイルを選択可能: 簡潔なSubtitle版、デフォルトのStage 2版、詳細なStrict版
大規模訓練データ
5万時間以上のスウェーデン語音声データで訓練され、2つの品質段階に分けられている

Model Capabilities

スウェーデン語音声認識
タイムスタンプ付き文字起こし
多フォーマット推論サポート
バッチ処理文字起こし

Use Cases

音声文字起こし
会議議事録
スウェーデン語会議録音を文字記録に変換
OpenAIオリジナルモデルと比べて精度が大幅に向上
字幕生成
スウェーデン語動画コンテンツの字幕生成
タイムスタンプ付きの正確な文字起こしを提供
音声分析
音声コンテンツ分析
研究やビジネスインテリジェンスのためのスウェーデン語音声コンテンツ分析
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase