D

Distil Large V2

distil-whisperによって開発
Distil-WhisperはWhisperモデルの蒸留版で、速度が6倍向上し、サイズが49%縮小され、非分布評価セットでの性能はWERでわずか1%の差しかありません。
ダウンロード数 42.65k
リリース時間 : 10/24/2023

モデル概要

Distil-WhisperはWhisperモデルの蒸留版で、英語音声認識に最適化されており、効率的な自動音声認識機能を提供します。

モデル特徴

効率的な推論
元のWhisperモデルより6倍高速で、リアルタイムアプリケーションに適しています。
サイズ最適化
モデルサイズが49%縮小され、メモリ使用量が減少します。
高性能
非分布評価セットでの性能は元のモデルと比べてWERでわずか1%の差しかありません。
長形式転写サポート
チャンクアルゴリズムによる長形式音声処理をサポートし、シーケンシャルアルゴリズムより9倍高速です。

モデル能力

英語音声認識
短形式音声転写
長形式音声転写
推測デコード

使用事例

音声転写
会議議事録
会議の録音を文字記録に変換します。
ポッドキャスト転写
ポッドキャストの内容を検索やアーカイブ用に文字に変換します。
支援技術
リアルタイム字幕生成
動画やライブ配信のためのリアルタイム字幕を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase