W

Whisper Large V3 Turbo

onnx-communityによって開発
ONNX形式で最適化されたWhisper大規模音声認識モデル、ウェブ展開向けに設計
ダウンロード数 2,988
リリース時間 : 10/1/2024

モデル概要

OpenAI Whisperの最適化版、効率的な音声テキスト変換をサポート、ONNX形式によりTransformers.jsと互換性確保

モデル特徴

ウェブ最適化
ONNX重みフォーマット採用、Transformers.js向け設計、ブラウザ環境での実行に適している
効率的な推論
Turbo版は推論速度を最適化、リアルタイム音声テキスト変換に適している
多言語対応
Whisperアーキテクチャベース、複数言語の音声認識をサポート

モデル能力

音声テキスト変換
多言語音声認識
リアルタイム音声処理

使用事例

音声文字起こし
会議議録自動化
会議録音をリアルタイムで文字起こし
議録作成効率向上、多言語会議をサポート
ポッドキャスト字幕生成
ポッドキャスト音声から自動で字幕生成
コンテンツアクセシビリティ向上、SEO最適化をサポート
音声アシスタント
ブラウザ音声制御
ウェブアプリで音声制御機能を実現
サーバー側処理不要、ユーザープライバシー保護
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase