W

Whisper Tiny.en

openaiによって開発
Whisperは、68万時間のアノテーション付きデータで学習された事前学習済みの自動音声認識(ASR)モデルで、強力な汎化能力を持っています。
ダウンロード数 145.30k
リリース時間 : 9/26/2022

モデル概要

Whisperは、Transformerベースのエンコーダー - デコーダーモデルで、英語音声認識タスクに特化しています。

モデル特徴

大規模学習
68万時間のアノテーション付き音声データで学習され、強力な汎化能力を示します。
微調整不要
微調整を行うことなく、複数のデータセットや領域に直接適用できます。
ロバスト性
アクセント、背景雑音、専門用語に対して強いロバスト性を示します。

モデル能力

英語音声認識
長い音声の文字起こし(チャンク処理による)

使用事例

音声文字起こし
会議記録
会議の録音を自動的に文字起こしして記録に残します。
ポッドキャストの文字起こし
英語のポッドキャストの内容を文字に変換します。
支援ツール
聴覚支援
聴覚障害者に対してリアルタイムの音声を文字に変換するサービスを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase