lite-whisper-large-v3オープンソース音声認識モデル - 高精度でモデルが小型でデプロイしやすい

Lite Whisper Large V3

efficient-speechによって開発

Lite-WhisperはOpenAI Whisperの圧縮バージョンで、LiteASR技術を採用し、高い精度を維持しながらモデルサイズを縮小しています。

ダウンロード数 70

リリース時間 : 2/26/2025

モデル概要

これはWhisper音声認識モデルの圧縮版で、効率的な音声認識のために設計されており、複数言語の自動音声テキスト変換タスクに適しています。

効率的な圧縮

LiteASR技術によりモデルサイズを大幅に縮小しつつ、オリジナルモデルに近い認識精度を維持

高速推論

最適化されたモデル構造により、より高速な音声認識処理をサポート

多言語サポート

複数言語の音声認識タスクに対応

音声テキスト変換

多言語音声認識

リアルタイム音声転写

音声転写

会議議事録

会議録音を自動的に文字記録に変換

平均WER 12.6%

ポッドキャスト転写

ポッドキャスト内容を自動的に文字原稿に変換

音声アシスタント

音声コマンド認識

ユーザーの音声コマンドを認識し、実行可能なコマンドに変換

モデル	平均WER (↓)	エンコーダサイズ	デコーダサイズ
whisper-large-v3	10.1	635M	907M
lite-whisper-large-v3-acc	10.1	429M	907M
lite-whisper-large-v3	10.2	377M	907M
lite-whisper-large-v3-fast	11.3	308M	907M

whisper-large-v3-turbo	10.1	635M	172M
lite-whisper-large-v3-turbo-acc	10.2	421M	172M
lite-whisper-large-v3-turbo	12.6	374M	172M
lite-whisper-large-v3-turbo-fast	20.1	313M	172M

whisper-medium	14.8	306M	457M