Lite Whisper Large V3 Turbo Acc
Lite-Whisper は LiteASR 技術で圧縮された OpenAI Whisper の軽量版で、高い精度を維持しながらモデルサイズを縮小しています。
ダウンロード数 7,414
リリース時間 : 2/26/2025
モデル概要
OpenAI Whisper を基にした軽量自動音声認識モデルで、低ランク近似技術による圧縮が施されており、効率的な音声からテキストへの変換タスクに適しています。
モデル特徴
高効率圧縮
LiteASR 技術を採用し、モデルサイズを大幅に縮小しながら高い精度を維持
高性能
ESB データセットでの平均 WER はわずか 10.2 で、オリジナルの Whisper に近い性能
高速推論
より小さなデコーダ(172M)を使用することで、より高速な推論を実現
モデル能力
音声からテキストへの変換
多言語音声認識
リアルタイム音声処理
使用事例
音声書き起こし
会議議事録
会議の録音を自動的に文字記録に変換
オリジナルの Whisper モデルに近い精度
字幕生成
動画コンテンツにリアルタイムで字幕を生成
音声アシスタント
音声コマンド認識
音声コマンドを認識して処理
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98