W

Whisper Large V3 Turbo Gguf

xkeyCによって開発
Whisper large-v3-turboはWhisper large-v3を基にしたプルーニングと微調整バージョンで、デコード層数を32から4に削減し、速度が大幅に向上しましたが、品質はわずかに低下しています。
ダウンロード数 546
リリース時間 : 3/20/2025

モデル概要

WhisperはOpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルで、500万時間以上の注釈付きデータでトレーニングされ、強力なゼロショット汎化能力を持っています。

モデル特徴

効率的な推論
デコード層数を32から4に削減し、推論速度が大幅に向上
多言語サポート
100以上の言語の音声認識と翻訳をサポート
ゼロショット汎化
未見のデータセットやドメインでも良好な性能を発揮
長音声処理
長い音声ファイルのチャンク処理をサポート

モデル能力

音声からテキストへ
多言語音声認識
音声翻訳(英語へ)
タイムスタンプ予測
言語検出

使用事例

音声文字起こし
会議議事録
会議の録音を自動的に文字記録に変換
高精度な会議議事録
ポッドキャスト文字起こし
ポッドキャストの内容を検索可能なテキストに変換
コンテンツの検索と分析が容易
音声翻訳
リアルタイム翻訳
外国語音声をリアルタイムで英語テキストに翻訳
異言語間コミュニケーションの架け橋
字幕生成
動画字幕
動画コンテンツに自動的に字幕を生成
動画のアクセシビリティ向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase