W

Whisper Large V3 Distil Fr V0.2

bofenghuangによって開発
フランス語音声テキスト変換に最適化されたWhisper蒸留版、デコーダ構造を2層のみ保持し精度を保ちつつ推論効率を向上
ダウンロード数 385
リリース時間 : 8/22/2024

モデル概要

OpenAI Whisper-large-v3を基にしたフランス語最適化蒸留モデル、デコーダ層削減と忍耐強い教師蒸留戦略により高効率音声認識を実現

モデル特徴

高効率推論
原モデル比5.8倍高速化、パラメータ49%削減、リソース制約環境に適応
長文最適化
30秒音声断片で訓練、長文転写能力強化、幻覚出力低減
マルチフレームワーク互換
transformers、faster-whisper、whisper.cppなど多様な推論フレームワーク対応
推論デコード対応
ドラフトモデルとして2倍加速可能、出力は原モデルと一致保証

モデル能力

フランス語音声テキスト変換
長音声転写
リアルタイム音声認識
ノイズ混じり音声処理

使用事例

コールセンター
顧客通話転写
背景雑音や専門用語を含む通話記録処理
社内テストで良好な性能
マルチメディア処理
フランス語動画字幕生成
フランス語コンテンツの自動字幕生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase