W

Whisper Tiny

openaiによって開発
Whisper TinyはOpenAIが開発した自動音声認識(ASR)モデルで、Whisperシリーズの中で最も小さいバージョンであり、パラメータ規模は39Mです。
ダウンロード数 328.82k
リリース時間 : 9/26/2022

モデル概要

WhisperはTransformerベースのエンコーダ-デコーダモデルで、自動音声認識や音声翻訳タスクに使用されます。このモデルは68万時間の注釈付き音声データで訓練されており、強力な汎化能力を示しています。

モデル特徴

大規模弱教師あり学習
68万時間の注釈付き音声データで訓練されており、強力な汎化能力を持つ
多言語サポート
複数言語の音声認識と翻訳タスクをサポート
ファインチューニング不要
多くのデータセットやドメインで良好な性能を発揮し、ファインチューニングが不要
軽量モデル
Tinyバージョンはわずか39Mパラメータで、リソースが限られた環境に適している

モデル能力

音声認識
音声翻訳
多言語処理

使用事例

音声書き起こし
会議議事録
会議の録音を自動的にテキストに書き起こす
LibriSpeechテストセットでWERが7.54(clean)と17.15(other)
ポッドキャスト書き起こし
ポッドキャストの内容を検索可能なテキストに変換する
音声翻訳
リアルタイム翻訳
ある言語の音声を別の言語のテキストにリアルタイムで翻訳する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase