W

Whisper Large V3 French Distil Dec16

bofenghuangによって開発
Whisper-Large-V3-フランス語蒸留版は、デコーダ層数を32層から16層に削減し、大規模データセットで蒸留訓練を行ったフランス語音声認識モデルです。このモデルは性能を維持しながら、メモリ消費量と推論時間を大幅に削減しました。
ダウンロード数 2,461
リリース時間 : 12/13/2023

モデル概要

これはフランス語に最適化された音声認識モデルで、蒸留技術によりモデルの複雑さを軽減しており、効率的な音声転写が必要なアプリケーションに適しています。

モデル特徴

効率的な蒸留アーキテクチャ
デコーダ層数を32層から16層に削減し、計算リソース要件を大幅に低減
性能維持
元のモデルと同等の精度を維持しながら推論速度を向上
長文処理の最適化
長文転写における幻覚リスクを効果的に軽減
マルチフレームワーク対応
transformers、openai-whisper、fasterwhisperなど複数の推論フレームワークをサポート

モデル能力

フランス語音声認識
長音声転写
リアルタイム音声テキスト変換

使用事例

カスタマーサポート
カスタマーサポート通話記録転写
フランス語のカスタマーサポート通話内容を自動的にテキストに転写
背景ノイズや専門用語を含むテストセットで良好な性能を発揮
メディア処理
フランス語動画字幕生成
フランス語の動画コンテンツに自動的に字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase