D

Distil Small.en

distil-whisperによって開発
Distil-WhisperはWhisperモデルの蒸留バージョンで、速度が6倍速く、サイズが49%縮小され、非分布評価セットで1% WERに近い性能を発揮します。
ダウンロード数 33.51k
リリース時間 : 12/6/2023

モデル概要

Distil-Whisperは英語音声認識専用の自動音声認識(ASR)モデルです。Whisperモデルの蒸留バージョンで、推論速度とモデルサイズを最適化しつつ、高い認識精度を維持しています。

モデル特徴

効率的推論
オリジナルWhisperモデルより6倍速く、リアルタイムアプリケーションに適しています
コンパクトモデル
サイズが49%縮小され、メモリ制約のあるデバイスサイドアプリケーションに適しています
高性能
非分布評価セットで1% WERに近い性能を発揮します
長文転写最適化
チャンクアルゴリズムを使用し、シーケンシャルアルゴリズムより9倍高速です

モデル能力

英語音声認識
短時間音声転写(<30秒)
長時間音声転写(>30秒)
推論デコード(Whisperの補助モデルとして)

使用事例

音声転写
会議議事録
会議録音を文字記録に変換します
迅速かつ正確な転写結果
ポッドキャスト転写
ポッドキャスト内容を文字に変換します
長時間音声の効率的な転写をサポート
デバイスサイドアプリケーション
モバイルデバイス音声アシスタント
スマートフォンなどのモバイルデバイスで音声認識機能を実現します
小型モデルがデバイスサイド展開に適しています
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase