W

Whisper Tiny German 1224

primelineによって開発
Whisperアーキテクチャを基に最適化されたドイツ語音声認識モデル、パラメータ数3900万、効率的なドイツ語音声転写をサポート
ダウンロード数 322
リリース時間 : 11/23/2024

モデル概要

これはドイツ語に特化して最適化された自動音声認識(ASR)モデルで、OpenAIのWhisperマイクロアーキテクチャを基に開発されており、様々なドイツ語音声処理シナリオに適しています

モデル特徴

効率的なドイツ語認識
ドイツ語に特化して最適化された音声認識モデルで、ドイツ語データセットにおいてベースラインのWhisperモデルよりも優れた性能を発揮します
軽量アーキテクチャ
Whisper-tinyアーキテクチャを採用、パラメータ数はわずか3900万で、リソースが限られた環境での展開に適しています
多様なシナリオ対応
転写、字幕生成、音声制御など、様々なドイツ語音声処理シナリオをサポートします

モデル能力

ドイツ語音声転写
音声コマンド認識
自動字幕生成
音声検索処理
ディクテーション機能サポート

使用事例

音声転写
ドイツ語会議議事録
ドイツ語の会議録音を自動的にテキスト記録に変換
単語誤り率6.26%(総合評価)
メディア処理
動画字幕生成
ドイツ語の動画コンテンツに自動的に字幕を生成
人間と機械のインタラクション
音声制御アプリケーション
ドイツ語音声制御インターフェースの開発
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase