W

Whisper Large V3 Distil Multi7 V0.2

bofenghuangによって開発
7つのヨーロッパ言語をサポートする多言語蒸留版Whisperモデルで、コードスイッチング機能を備えています
ダウンロード数 119
リリース時間 : 12/5/2024

モデル概要

これはWhisper-Large-v3を基にした蒸留モデルで、7つのヨーロッパ言語(英語、フランス語、スペイン語、ドイツ語、イタリア語、ポルトガル語、オランダ語)の自動音声認識に最適化されています。モデルは2つのデコーダ層を持ち、特にコードスイッチング機能をサポートし、多言語混合の音声入力を自動検出して処理できます。

モデル特徴

多言語サポート
7つのヨーロッパ言語(英語、フランス語、スペイン語、ドイツ語、イタリア語、ポルトガル語、オランダ語)の音声認識をサポート
コードスイッチング機能
音声中の言語変化を自動検出し、対応する言語タグを生成することで、シームレスな多言語転写を実現
効率的な蒸留アーキテクチャ
デコーダ層を2層のみに削減し、良好な性能を維持しながら推論効率を向上

モデル能力

自動音声認識
多言語転写
コードスイッチング検出
音声からテキストへの変換

使用事例

多言語転写
多言語会議議事録
複数言語を含む会議録音を自動転写
言語切り替えを正確に認識し、対応する言語のテキストを生成
多言語メディアコンテンツ処理
複数言語を含むポッドキャスト、動画などのメディアコンテンツを処理
言語タグ付きの転写テキストを生成
音声分析
多言語音声データ分析
複数言語を含む音声データセットを分析
後続分析のための正確なテキスト転写を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase