D

Distil Large V3

distil-whisperによって開発
Distil-WhisperはWhisper large-v3の知識蒸留バージョンで、英語自動音声認識に特化し、より高速な推論速度を提供しながら、オリジナルモデルに近い精度を維持します。
ダウンロード数 417.11k
リリース時間 : 3/21/2024

モデル概要

これはDistil-Whisper英語シリーズの第3バージョンで、大規模な擬似ラベル知識蒸留技術を用いて開発され、長文転写の精度を最適化し、前世代バージョンと比べて性能が大幅に向上しています。

モデル特徴

効率的な推論
オリジナルのWhisper large-v3モデルより6.3倍速く、前世代のdistil-large-v2より1.1倍速い
長文転写最適化
シーケンシャル長文アルゴリズムを使用して、より優れた長文転写精度を提供
主流ライブラリとの互換性
Whisper cpp、Faster-Whisper、OpenAI Whisperなどの人気ライブラリと互換性を持つように設計

モデル能力

英語音声認識
短文音声転写
長文音声転写
タイムスタンプ生成

使用事例

音声転写
会議議事録
会議録音を文字記録に変換
オリジナルWhisper large-v3モデルに近い精度
ポッドキャスト転写
長文ポッドキャストコンテンツを文字に変換
シーケンシャルアルゴリズム使用時、distil-large-v2より4.8%精度向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase