W

Whisper Large V3 Distil Multi4 V0.2

bofenghuangによって開発
これは多言語蒸留版のWhisperモデルで、2つのデコーダー層を持ち、4つのヨーロッパ言語(英語、フランス語、スペイン語、ドイツ語)をサポートしています。
ダウンロード数 70
リリース時間 : 12/5/2024

モデル概要

このモデルはWhisper-large-v3の蒸留版で、英語、フランス語、スペイン語、ドイツ語の自動音声認識タスクに特化しており、コードスイッチング機能をサポートしています。

モデル特徴

多言語サポート
英語、フランス語、スペイン語、ドイツ語の4つのヨーロッパ言語の音声認識をサポート
コードスイッチング
言語を自動検出し切り替えることができ、単一のセグメント文字起こしで複数言語を処理
蒸留アーキテクチャ
蒸留技術を用いてモデルを圧縮し、元のモデルの性能を維持しながら計算リソースの要求を削減

モデル能力

多言語音声認識
自動言語検出
コードスイッチング処理

使用事例

音声文字起こし
多言語会議議事録
複数言語を含む会議録音を文字起こし
異なる言語セグメントを自動認識し切り替え
多言語ポッドキャスト文字起こし
複数言語を含むポッドキャストコンテンツをテキストに変換
異なる言語段落を正確に認識し注釈付け
音声アシスタント
多言語音声入力
ユーザーが複数言語を混在させた音声入力をサポート
言語切り替えをシームレスに処理
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase