K

Kb Whisper Large

KBLabによって開発
スウェーデン国立図書館が公開したWhisperアーキテクチャに基づくスウェーデン語音声認識モデルで、5万時間以上のトレーニングデータを使用し、単語誤り率を大幅に低減しています。
ダウンロード数 8,880
リリース時間 : 2/14/2025

モデル概要

スウェーデン語に最適化された音声認識モデルで、OpenAI Whisperアーキテクチャに基づき、複数のスウェーデン語データセットで優れた性能を発揮します。

モデル特徴

単語誤り率の大幅な低減
OpenAIのオリジナルモデルと比較して、スウェーデン語認識において平均47%の単語誤り率(WER)を低減
マルチフォーマット対応
Hugging Face、whisper.cpp(GGML)、onnx、ctranslate2など複数の形式のモデルチェックポイントを提供
複数バージョンの文字起こしスタイル
字幕版(簡潔)、標準版(デフォルト)、厳密版(逐語的)の3種類の文字起こしスタイルバージョンを提供
大規模トレーニングデータ
5万時間以上のスウェーデン語音声データに基づくトレーニングを実施し、2つの品質段階でトレーニングを実施

モデル能力

スウェーデン語音声認識
タイムスタンプ付き音声文字起こし
マルチフォーマット推論サポート
バッチ処理音声文字起こし

使用事例

音声文字起こし
会議議事録の文字起こし
スウェーデン語の会議録音をテキスト記録に変換
高精度な文字起こしテキスト
字幕生成
スウェーデン語の動画コンテンツに字幕を生成
タイムスタンプ付き字幕ファイル
音声分析
音声コンテンツ分析
スウェーデン語音声コンテンツを分析して後処理を実施
構造化されたテキストデータ
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase